TAILIEUCHUNG - DATA MINING AND APPLICATION: BÀI TOÁN KHAI THÁC

QUI TRÌNH B0 : cây FP B1 : (conditional pattern bases) cho nút trên cây FP). B2 : cây FP (conditional FP tree) B3 : Khai thác qui cây FP và phát cho khi cây FP 1 duy ra các | I III _ KHAI THÁC DỮ LIỆU ỨNG DỤNG DATA MINING GV NGUYỄN HOÀNG TỦ ANH 1 Q BÀ 3 -PHẦN 2 KHAI THÁC TẬP PHÔ BIẾN LUẬT KẾT HỢP 2 1 nôidung GIỚI THIỆU 1 Bài toán khai thác tập phồ biến là bài toán rất quan trọng lĩnh vực KTDL vạch ra tính M chất ẩn quan trọng của tập DL Tất cả các tập con của tập phổ biến đều là tập phổ biến Tập phổ biến tối đại tập bao phổ biến Bài toán khai thác LKH là bài toán tìm tất cả các luật dạng X Y X Y c I và XqY thỏa mãn độ phổ biến và độ tin cậy tối thiểu a supp XY minsupp conf XY minconf 4 2 GIỚI THIỆU Bài toán khai thác tập phổ biến là bài toán tìm tất cả các tập các hạng mục S hay tập phổ biến S có độ phổ biến thỏa mãn độ phổ biến tối thiểu minsupp supp S minsupp Btf Cách giải quyết dựa trên tính chất của tập phổ biến Tìm kiếm theo chiều rộng Thuật toán Apriori 1994 Phát triển mẫu Thuật toán FP-Growth 2000 Tìm kiếm trên CSDL hàng dọc Thuật toán Charm 2002 GIỚI THIỆU__ I Các hạn chế của Thuật toán Apriori I Phải duyệt CSDL nhiều lần I Khi khai thác các mẫu dài cần duyệt CSDL nhiều lần và tạo lượng lớn tập ứng viên HH Ví dụ Để tìm tập phổ biến i1 i2. i100 Số lần duyệt CSDL 100 Số lượng ứng viên 2100-1 1030 ỗ Vấn đề tạo ứng viên và kiểm tra CÓ thể tránh việc tạo ứng viên hay không 6

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.