Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Một số bài toán điển hình về data mining: Bài toán khám phá luật kết hợp; Bài toán phân loại dữ liệu; Bài toán gom nhóm dữ liệu; Bài toán lập mô hình; Bài toán dự báo; | Chương 7: Khai mỏ dữ liệu Phần III: Khai mỏ dữ liệu và khám phá tri thức Tham khảo thêm: [1] GS.TSKH Hoàng Kiếm. Bài giảng cao học môn học cơ sở tri thức và ứng dụng. ĐHKHTN-TPHCM. [2] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998 [3] Citeseer - Scientific Literature Digital Library. Artificial Intelligence-http://citeseer.nj.nec.com/ArtificialIntelligence/ - 2003 Bài toán khám phá luật kết hợp Bài toán phân loại dữ liệu Bài toán gom nhóm dữ liệu Bài toán lập mô hình Bài toán dự báo I. Một số bài toán điển hình về data mining I. Một số bài toán điển hình về data mining (tt) a. Phát hiện luật kết hợp (association rules) Tìm ra những mối liên hệ giữa các trường mô tả đối tượng trong CSDL và xây dựng thành các luật cụ thể. Luật kết hợp là tri thức quan trọng nhất tiềm ẩn trong CSDL. Ví dụ: Sau khi phân tích một CSDL bán hàng ta tìm ra được các luật (1): Nếu khách hàng mua món A cũng sẽ mua . | Chương 7: Khai mỏ dữ liệu Phần III: Khai mỏ dữ liệu và khám phá tri thức Tham khảo thêm: [1] GS.TSKH Hoàng Kiếm. Bài giảng cao học môn học cơ sở tri thức và ứng dụng. ĐHKHTN-TPHCM. [2] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998 [3] Citeseer - Scientific Literature Digital Library. Artificial Intelligence-http://citeseer.nj.nec.com/ArtificialIntelligence/ - 2003 Bài toán khám phá luật kết hợp Bài toán phân loại dữ liệu Bài toán gom nhóm dữ liệu Bài toán lập mô hình Bài toán dự báo I. Một số bài toán điển hình về data mining I. Một số bài toán điển hình về data mining (tt) a. Phát hiện luật kết hợp (association rules) Tìm ra những mối liên hệ giữa các trường mô tả đối tượng trong CSDL và xây dựng thành các luật cụ thể. Luật kết hợp là tri thức quan trọng nhất tiềm ẩn trong CSDL. Ví dụ: Sau khi phân tích một CSDL bán hàng ta tìm ra được các luật (1): Nếu khách hàng mua món A cũng sẽ mua món B. (2): Nếu khách hàng mua món C thì tháng sau sẽ mua món D. I. Một số bài toán điển hình về data mining (tt) b. Phân lớp (classification) Lớp A Lớp B Lớp C Phân những đối tượng dữ liệu có đặc trưng của lớp C vào lớp C I. Một số bài toán điển hình về data mining (tt) c. Gom nhóm (Clustering) Nhoùm 1 Nhoùm 2 Nhoùm 3 Gom những đối tượng dữ liệu tương tự vào 1 nhóm Tham khảo thêm: [1] Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998 [2] Citeseer - Scientific Literature Digital Library. Artificial Intelligence-http://citeseer.nj.nec.com/ArtificialIntelligence/ - 2003 II. Luật kết hợp Một số khái niệm: Cho I = {i1, i2, i3, , in} là tập hợp các trường gọi là items D: tập các giao tác có các giao tác Ti mà Ti I T chứa X nếu X T (X là tập có các phần tử I). Mỗi giao tác Ti có chỉ danh là TID. Luật kết hợp là một mối liên hệ điều kiện giữa hai tập các hạng mục dữ liệu X và Y theo dạng .