TAILIEUCHUNG - Thuật toán song song khai thác tập sinh tối thiểu của tập phổ biến đóng
Trong bài viết này, chúng tôi đề xuất thuật toán song song MCP-mGCFI khai thác nhanh tập sinh tối thiểu của tập phổ biến đóng trên bộ xử lý đa nhân. Thuật toán đề xuất dễ dàng mở rộng trên nhiều hệ thống tính toán phân tán như Hadoop, Spark. Kết quả thực nghiệm trên bộ dữ liệu thực của UCI và bộ dữ liệu giả lập của trung tâm nghiên cứu IBM Almaden, cho thấy thuật toán đề xuất hiệu quả. | Thuật toán song song khai thác tập sinh tối thiểu của tập phổ biến đóng Thuật Toán Song Song Khai Thác Tập Sinh Tối Thiểu của Tập Phổ Biến Đóng Phan Thành Huấn1,2 1 Bộ môn Tin học, Trường Đại học Khoa học Xã hội và Nhân văn, 2 Khoa Toán – Tin học, Trường Đại học Khoa học Tự nhiên, Email: huanphan@ Tóm tắt - Trong khai thác dữ liệu, khai thác luật kết hợp là một dựng thuật toán xác định mảng chứa itemset xuất hiện ít nhất trong những kỹ thuật quan trọng và được nghiên cứu nhiều. Đặc trong một giao dịch của từng item hạt nhân, thuật toán sinh cây biệt là kỹ thuật khai thác luật kết hợp chính xác và không dư nLOOC-Tree và thuật toán tuần tự SEQ-mGCFI khai thác thừa, một số tác giả đã đề xuất khai thác luật kết hợp này từ tập tập sinh tối thiểu. Phần 4, nhóm tác giả dựa trên thuật toán tuần sinh tối thiểu của tập phổ biến đóng. Trong bài viết này, chúng tự ở Phần 3 để xây dựng thuật toán song song MCP-mGCFI tôi đề xuất thuật toán song song MCP-mGCFI khai thác nhanh tập sinh tối thiểu của tập phổ biến đóng trên bộ xử lý đa nhân. khai thác hiệu năng của bộ xử lý đa nhân. Kết quả thực nghiệm Thuật toán đề xuất dễ dàng mở rộng trên nhiều hệ thống tính được trình bày trong phần 5 và kết luận ở phần 6. toán phân tán như Hadoop, Spark. Kết quả thực nghiệm trên bộ dữ liệu thực của UCI và bộ dữ liệu giả lập của trung tâm nghiên II. CÁC KHÁI NIỆM CƠ BẢN cứu IBM Almaden, cho thấy thuật toán đề xuất hiệu quả. A. Tập phổ biến Từ khóa - Bộ xử lý đa nhân, luật kết hợp, tập sinh tối thiểu, tập Cho I = {i1, i2,., im} là tập gồm m mục hàng, mỗi mục phổ biến đóng, thuật toán song song MCP-mGCFI. hàng gọi là item. Tập các item X ={i1, i2,., ik}, ∀ij ∈ I (1≤ j ≤ k) gọi là itemset, itemset có k item gọi là k-itemset. Ɗ là dữ I. GIỚI THIỆU liệu giao dịch, gồm n bản ghi gọi là tập các giao dịch T = {t1, Năm 1993, đã đề xuất mô hình cơ bản khai t2,., tn}, mỗi giao dịch tk ={ik1, ik2,.,
đang nạp các trang xem trước