TAILIEUCHUNG - Khai thác nhanh mẫu phổ biến trên cơ sở dữ liệu trọng số

Trong bài viết này tác giả đề xuất một định lý để tính nhanh độ hỗ trợ trọng số trên cấu trúc MBiS giúp giảm thời gian tính toán trong quá trình khai thác mẫu phổ biến trên cơ sở dữ liệu trọng số. Các kết quả thực nghiệm đã cho thấy phương pháp đề xuất hiệu quả hơn các phương pháp dựa trên MBiS, IWS, NFWI về thời gian thực thi. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIV về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR TP. HCM ngày 23-24 12 2021 DOI KHAI THÁC NHANH MẪU PHỔ BIẾN TRÊN CƠ SỞ DỮ LIỆU TRỌNG SỐ Nguyễn Duy Hàm Khoa Công nghệ thông tin - Trường Đại học Công nghệ TP. Hồ Chí Minh Trường Cao đẳng An ninh mạng iSPACE TÓM TẮT Khai thác mẫu là bài toán quan trọng tiền đề cho khai thác luật kết hợp nhằm tìm mối quan hệ hữu ích của các mục trong dữ liệu. Khai thác mẫu cũng là bài toán quan trọng có nhiều ứng dụng trong các hệ thống thông minh. Do đó khai thác mẫu là bài toán được quan tâm nghiên cứu từ rất sớm nhiều nghiên cứu đề xuất các thuật toán phương pháp khai thác khá hiệu quả như đề xuất các cấu trúc Nlist cấu trúc bit véctơ DBV MBiS IWS sử dụng để tăng tốc độ tính toán trên các cơ sở dữ liệu dày. So với các tiếp cận khác thì Bit véctơ khá hiệu quả giảm bộ nhớ lưu trữ và tăng tốc độ tính toán do sử dụng các phép toán bitwise. Trong bài báo này tác giả đề xuất một định lý để tính nhanh độ hỗ trợ trọng số trên cấu trúc MBiS giúp giảm thời gian tính toán trong quá trình khai thác mẫu phổ biến trên cơ sở dữ liệu trọng số. Các kết qủa thực nghiệm đã cho thấy phương pháp đề xuất hiệu quả hơn các phương pháp dựa trên MBiS IWS NFWI về thời gian thực thi. Từ khoá Mẫu phổ biến cơ sở dữ liệu trọng số bit véctơ MBiS. I. GIỚI THIỆU Khai thác mẫu phổ biến là bài toán quan trọng có nhiều ứng dụng trong thực tế. Nhu cầu về tìm mối liên hệ giữa các dữ liệu trong cơ sở dữ liệu CSDL là rất lớn và thực tế nên các nghiên cứu về mẫu phổ biến luật kết hợp đã được quan tâm từ rất sớm 1-2 . Trong khai thác mẫu phổ biến có ba hướng tiếp cận chính đó là Thuật toán Apriori 1 thuật toán này theo tư tưởng vét cạn các khả năng sinh ra tập phổ biến bằng cách sinh tập phổ biến nhiều phần tử hơn từ tập phổ biến ít phần tử đã tìm thấy trước đó. Do việc quét CSDL nhiều lần nên cách tiếp cận này rất tốn thời gian sau đó giải pháp sử dụng .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.