TAILIEUCHUNG - Khai phá tập mục thường xuyên cổ phần cao trong cơ sở dữ liệu lớn

Trong bài báo này, các tác giả đề xuất một cải tiến của thuật toán FSM. Việc cải tiến được thực hiện thông qua một chiến lược tỉa hiệu quả hơn các tập mục ứng viên, nhờ đó giảm bớt được thời gian hiện thuật toán khai phá. nội dung chi tiết. | Tạp chí Tin học và Điều khiển học 2008 168-178 KHAI PHÁ TẬP MỤC THƯỜNG XUYÊN cổ PHÂN CAO TRONG Cơ SỞ DỮ LIỆU LỚN VŨ ĐỨC THI1 NGUYỄN HUY ĐỨC2 1 Viện Công nghệ thông tin Viện Khoa học và Công nghệ Việt Nam 2Khoa Thông tin - Máy tính Trường Cao đẳng Sư phạm Trung ương Abstract. Itemsets share has been proposed to evaluate the significance of itemsets for mining association rules in databases. The Fast Share Measure FSM algorithm is one of the best algorithms to discover all share-frequent itemsets efficiently. However FSM is fast only when dealing with small datasets. In this paper we shall propose a revised version of FSM called the Advanced FSM AFSM algorithm. AFSM prune the candidates more efficiently than FSM and therefore can improve the performance significantly. Tóm tắt. Khai phá tập mục thường xuyên cổ phần cao Share-Frequent Itemset là một mờ rộng của bài toán khai phá tập mục thường xuyên đã được các tác giả đề xuất với mục đích đánh giá ý nghĩa của các tập mục trong khai phá luật kết hợp. Thuật toán FSM Fast Share Measure là một trong các thuật toán tốt để khai phá hiệu quả các tập mục thường xuyên cổ phần cao. Trong báo cáo này chúng tôi đề xuất một cải tiến của thuật toán FSM. Việc cải tiến được thực hiện thông qua một chiến lược tỉa hiệu quả hơn các tập mục ứng viên nhờ đó giảm bớt được thời gian thực hiện thuật toán khai phá. 1. MỞ ĐẦU Bài toán cơ bản hay còn gọi là bài toán nhị phân khai phá luật kết hợp do Agrawal và A. N. Swami đề xuất và nghiên cứu lần đầu tiên vào năm 1993 4 mục tiêu của bài toán là phát hiện các tập mục thường xuyên từ đó tạo các luật kết hợp. Trong mô hình của bài toán nhị phân này giá trị của mỗi mục dữ liệu trong một giao tác là 0 hoặc 1. Bài toán cơ bản khai phá luật kết hợp có nhiều ứng dụng tuy vậy do tập mục thường xuyên chỉ mang ngữ nghĩa thống kê nên nó chỉ đáp ứng được phần nào nhu cầu ứng dụng thực tiln. Nhằm khắc phục hạn chế của bài toán cơ bản khai phá luật kết hợp nhiều nhà nghiên cứu đã mở .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.