TAILIEUCHUNG - DATA MINING AND APPLICATION: ĐỀ THI CUỐI KỲ

Câu 1 : Cho CSDL giao dịch sau và minsupp = 60%, minconf = 70% a) Hãy sử dụng lần lượt các thuật toán Apriori và FP-Growth để tìm tất cả các tập phổ biến . Liệt kê các tập phổ biến tối đại và tập bao phổ biến. b) Tìm các luật kết hợp được xây dựng từ các tập phổ biến tối đại thỏa mãn các ngưỡng minsupp, minconf đã cho TID 100 200 300 400 500 Câu 2 : Cho CSDL huấn luyện sau :. STT Màu tóc Chiều cao (cm) Cân nặng (kg) Có gia đình Kết. | Trường Đại Học Khoa Học Tự Nhiên Khoa Công Nghệ Thông Tin X ĐỀ THI MÔN KHAI THÁC DỮ LIỆU VÀ ỨNG DỤNG Thời gian 120 phút Được sử dụng tài liệu Câu 1 Cho CSDL giao dịch sau và minsupp 60 minconf 70 a Hãy sử dụng lần lượt các thuật toán Apriori và FP-Growth để tìm tất cả các tập phổ biến . Liệt kê các tập phổ biến tối đại và tập bao phổ biến. b Tìm các luật kết hợp được xây dựng từ các tập phổ biến tối đại thỏa mãn các ngưỡng minsupp minconf đã cho TID Items 100 K D A B C F 200 A H C D 300 C I D E G F 400 B C H A I D F G 500 F C K E G Câu 2 Cho CSDL huấn luyện sau . STT Màu tóc Chiều cao cm Cân nặng kg Có gia đình Kết quả 1 1 130 35 0 Có mua 2 1 170 60 1 Không 3 2 150 50 1 Không 4 1 155 55 0 Có mua 5 3 145 62 0 Có mua 6 2 175 85 0 Không 7 2 138 60 0 Không 8 1 158 40 1 Không 9 2 180 75 1 Có mua 10 3 120 42 0 Không a. Sử dụng thuật toán 5-NN để xác định lớp cho đối tượng mới STT Màu tóc Chiều cao cm Cân nặng kg Có gia đình Kết quả 11 1 135 37 1 b. Biển đổi CSDL trên về dạng có thể áp dụng thuật toán ILA hoặc cây quyết định. Xây dựng tập luật phân lớp trên CSDL đã biến đổi dùng cây quyết định hoặc ILA . Sử dụng bộ luật phân lớp để xác định lớp cho đối tượng số 11 trong câu a . So sánh và nhận xét kết quả với câu a. Câu 3 Hãy trình bày một phương pháp cải tiến thuật toán tìm tập phổ biến Apriori. Nêu ý tưởng chính và mã giả cuả thuật toán cải tiến . HẾT Đề nghị các giáo viên coi thi không giải thích gì thêm Trường Đại Học Khoa Học Tự Nhiên Khoa Công Nghệ Thông Tin ĐỀ THI MÔN KHAI THÁC DỮ LIỆU VÀ ỨNG DỤNG Thời gian 120 phút Được sử dụng tài liệu không sử dụng laptop Câu 1 Cho CSDL sau TID A B C D E F G H I 10 1 1 1 1 20 1 1 30 1 1 1 1 1 40 1 1 1 1 1 1 1 50 1 1 1 1 1 1 c Hãy sử dụng một trong hai thuật toán Apriori hoặc FP-Growth để tìm tất cả các tập phổ biến thỏa mãn ngưỡng minsupp 60 . Liệt kê các tập phổ biến tối đại và tập bao phổ biến. d Tìm các luật kết hợp được xây dựng từ tập phổ biến tối đại thỏa mãn ngưỡng minconf 80 . e Tính độ đo Interest của các luật tìm được

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.