TAILIEUCHUNG - Khám phá tập mục lợi ích cao trong cơ sở dữ liệu

Báo cáo này trình bày một thuật toán hiệu quả khám phá tập mục lợi ích cao trong cơ sở dữ liệu lớn. Việc tỉa các tập mục ứng viên được thực hiện thông qua giá trị mà tác giả gọi là lợi ích kéo theo của tập mục trong giao dịch. | Một số vẩn đề chọn lọc cùa Cồng nghệ thông tin và truyền thổng Đợi Lài 4-15 tháng 9 nám 2007 KHÁM PHÁ TẬP MỤC LỢI ÍCH CAO TRONG Cơ SỞ Dữ LIỆU Nguyễn Thanh Tùng Viện Công nghệ Thông tín - Viện Khoa học và Công nghệ việt nam Bài toán cơ bàn khai phả luật kết hợp được R. Agrawal T. Imielinski và A. N. Swami đề xuất và nghiên cứu lần đầu tiên vào nân ỉ993. Mục tiêu của nó là phát hiện các tập mục phổ biến từ đỏ tạo các luật kểt hợp. Tuy nhiên do tập mục phổ biển chỉ mang ngữ nghĩa thống kê nên mô hình bài toán cơ bàn chỉ đáp ứng được phần nào nhu cầu ứng dụng thực tiễn. Gần đây nhằm khắc phục hạn chể cùa bài toán cơ bán khai phả luật kết hợp H. Yao H. J. Hamilton và một sổ nhà nghiên cửu khác đã đề xuất bài toán khám phá tập mục lợi ích cao mining high utility Itemsets . Do ràng buộc lợi ỉch cao không thỏa măn tính chất Apríori nên việc tỉa các ứng viên thu gọn không gian tìm kiếm tập mục lợi ích cao không thể thực hiện được như trong khai phá tập mục phổ biển. Năm 2006 H. Yao và H. J. Hamilton đã đề nghị hai thuật toán khảm phả tập mục lợi ích cao bằng cách tỉa các ứng viên dựa trên giá trị lợi ích ước lượng estimated utility value và giá trị lợi ích dự đoán bằng phương pháp heuristic heuristic predicted utility value . Cảc thuật tia này cỏ khả năng thu gọn phần nào không gian tìm kiểm tuy nhiên có những nhược diem nên hiệu quả không cao. Báo cảo này trình bày một thuật toán hiệu quà khảm phả tập mục lợi ích cao trong cơ sở dữ liệu lởn. Việc tia các tập mục ứng viên được thực hiện thông qua giả trị mà chủng tôi gọi là lợi ỉch kéo theo của tập mục trong giao dịch 1. Mở đầu. Đài toán cơ bản hay còn gọi bài toán nhị phân bài toán truyền thổng khai phá luật kết hợp do R. Agrawal T. Imielinski và A. N. Swami đề xuất và nghiên cứu lần đầu tiên vào năm 1993 1 2 . Mục tiêu của nó là phát hiện các tập mục phổ biến từ đó tạo các luật kết hợp. Tuy nhiên do tập mục phổ biến chỉ mang ngữ nghĩa thống kê nên mô hình bài toán cơ bản chỉ đáp ứng được phần nào nhu cầu ứng dụng thực .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.