Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Bài giảng Khai phá dữ liệu: Chương 4 Khai phá luật kết hợp, cung cấp cho người học những kiến thức như: Khai phá luật kết hợp (Association rule); Các thuật toán khai phá vô hướng luật kết hợp (giá trị lôgic đơn chiều) trong CSDL giao dịch; Khai phá kiểu đa dạng luật kết hợp/tương quan; Khai phá kết hợp dựa theo ràng buộc; Khai phá mẫu dãy. Mời các bạn cùng tham khảo! | Chương 4 Khai phá luật kết hợp KHAI PHÁ DỮ LIỆU Nội dung 1. Khai phá luật kết hợp Association rule 2. Các thuật toán khai phá vô hướng luật kết hợp giá trị lôgic đơn chiều trong CSDL giao dịch 3. Khai phá kiểu đa dạng luật kết hợp tương quan 4. Khai phá kết hợp dựa theo ràng buộc 5. Khai phá mẫu dãy DW DM 214 1. Khai phá luật kết hợp Một số ví dụ về luật kết hợp associate rule 98 khách hàng mà mua tạp chí thể thao thì đều mua các tạp chí về ôtô sự kết hợp giữa tạp chí thể thao với tạp chí về ôtô 60 khách hàng mà mua bia tại siêu thị thì đều mua bỉm trẻ em sự kết hợp giữa bia với bỉm trẻ em Có tới 70 người truy nhập Web vào địa chỉ Url 1 thì cũng vào địa chỉ Url 2 trong một phiên truy nhập web sự kết hợp giữa Url 1 với Url 2 . Khai phá dữ liệu sử dụng Web Dữ liệu từ file log của các site chẳng hạn được MS cung cấp . Các Url có gắn với nhãn lớp là các đặc trưng thì có luật kết hợp liên quan giữa các lớp Url này. DW DM 215 Khái niệm cơ sở Tập phổ biến và luật kết hợp IV06 Renáta Iváncsy István Vajk 2006 . Frequent Pattern Mining in Web DW DM Log Data Acta Polytechnica Hungarica 3 1 77-90 2006 216 Khái niệm cơ sở Tập phổ biến và luật kết hợp Cơ sở dữ liệu giao dịch transaction database Giao dịch danh sách các mục mục item mặt hàng trong một phiếu mua hàng. Giao dịch T là một tập mục. Tập toàn bộ các mục I i1 i2 ik tất cả các mặt hàng . Một giao dịch T là một tập con của I T I. Mỗi giao dịch T có một định danh là TID. A là một tập mục A I và T là một giao dịch Gọi T chứa A nếu A T. Luật kết hợp Gọi A B là một luật kết hợp nếu A I B I và A B . Luật kết hợp A B có độ hỗ trợ support s trong CSDL giao dịch D nếu trong D có s các giao dịch T chứa AB chính là xác suất P AB . Tập mục A có P A s gt 0 với s cho trước được gọi là tập phổ biến frequent set . Luật kết hợp A B có độ tin cậy confidence c trong CSDL D nếu như trong D có c các giao dịch T chứa A thì cũng chứa B chính là xác suất P B A . Support A B P A B 1 s A B 0 Confidence A B P B A 1 c A B 0 Luật A B được gọi là .