Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Bài giảng Tìm kiếm và trình diễn thông tin: Bài 17 - Phát hiện trùng lặp gần sẽ cung cấp cho các bạn một số vấn đề cơ bản về trùng lặp tuyệt đối; trùng lặp gần; người dùng không mong muốn những kết quả trùng lặp; mô hình tập shingles;. | 1 IT4853 Tìm kiếm và trình diễn thông tin Phát hiện trùng lặp gần Giảng viên TS. Nguyễn Bá Ngọc Địa chỉ Viện CNTT TT BM HTTT B1-603 Email ngocnb@soict.hust.edu.vn Website http is.hust.edu.vn ngocnb 2 Phát hiện trùng lặp Trùng lặp tuyệt đối Dễ dàng loại bỏ v.d. bằng tổng đại diện. Trùng lặp gần Khó phát hiện Người dùng không mong muốn những kết quả trùng lặp. Có thể coi một tài liệu vốn phù hợp là không phù hợp nếu lặp lại ngay trong danh sách kết quả. Cần loại bỏ những tài liệu trùng lặp