TAILIEUCHUNG - Bài giảng Khai phá dữ liệu (Data mining): Chương 1 - Lê Tiến

Chương 1 của bài giảng Khai phá dữ liệu trình bày những nội dung tổng quan về khai phá dữ liệu. Các nội dung chính trong chương này gồm có: Quá trình khám phá tri thức, các khái niệm, ý nghĩa và vai trò của khai phá dữ liệu, ứng dụng của khai phá dữ liệu. . | Chương 1: Tổng quan về khai phá dữ liệu Khai phá dữ liệu (Data mining) Nội dung . Tình huống . Quá trình khám phá tri thức . Các khái niệm . Ý nghĩa và vai trò của khai phá dữ liệu . Ứng dụng của khai phá dữ liệu . Tóm tắt . Tình huống 1 Người đang sử dụng thẻ ID = 1234 thật sự là chủ nhân của thẻ hay là một tên trộm? . Tình huống 2 Ông A (Tid = 100) có khả năng trốn thuế??? . Tình huống 3 Ngày mai cổ phiếu STB sẽ tăng??? . Tình huống 4 Khóa MãSV MônHọc1 MônHọc2 TốtNghiệp 2004 1 Có 2004 2 Có 2004 3 Không 2004 8 Không 2004 14 Có 2005 90 Có (80%) 2006 24 Có (90%) 2007 82 Không (45%) 2008 47 Không (97%) Làm sao xác định được khả năng tốt nghiệp của một sinh viên hiện tại? . Tình huống We are data rich, but information poor. “Necessity is the mother of invention”. - Plato . Quá trình khám phá tri thức Data Cleaning Data Integration Data Sources Data Warehouse Knowledge Task-relevant Data Selection/Transformation Data Mining Pattern Evaluation/ Presentation Patterns . Quá trình khám phá tri thức “Knowledge discovery in databases is the nontrivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data.” Frawley, W. J et al. (1991). Knowledge discovery in databases: an overview. “Knowledge discovery from databases is the process of using the database along with any required selection, preprocessing, sub-sampling, and transformations of it; to apply data mining methods (algorithms) to enumerate patterns from it; and to evaluate the products of data mining to identify the subset of the enumerated patterns deemed knowledge.” Fayyad, et al. (1996). Advances in Knowledge Discovery and Data Mining. MIT Press. . Quá trình khám phá tri thức Quá trình khám phá tri thức là một chuỗi lặp gồm các bước: Data cleaning (làm sạch .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.