TAILIEUCHUNG - MultiBooks - Tổng hợp IT - PC part 22

Giáo trình Multibooks - Tổng hợp IT. Bài giảng Multimedia, Cẩm nang Microsoft Office Word 2007, EbookUBUNTU, Kĩ nghệ đóng gói sotfs, Python, The OpenBSD Crash Course (2007), W7, Wvista. Bao gồm hệ thống các bài giảng, tips - sẽ hướng dẫn các bạn cụ thể, hiệu quả về các vấn đề trong chương trình mà ebook cập nhật tới. Đây sẽ là 1 quyển sách cần thiết đối với các bạn mún theo môn học này. | Giả sử di và dj là hai tài liệu. Tính tương tự của hai tài liệu theo biểu diễn SVD TS x D t của bảng tần số được cho bởi giá trị tích vô hướng hai cột trong ma trận D T kết hợp với hai tài liệu đó Ở đây ma trận đơn sau khi rút gọn sẽ có kích thước R x R . Chú ý rằng thay vì so sánh toàn bộ M khái niệm cho hai tài liệu này ta chỉ so sánh R khái niệm nó là số nhỏ hơn M rất nhiều thông thường là 200 . Tìm kiếm phù hợp p đầu tiên cho truy vấn Q Giả sử Q là truy vấn. Ta coi Q như tài liệu và tạo lập véctơ vecQ cho nó như trên đây. Tuy nhiên có một điểm khác là Chỉ R khái niệm quan trọng là được xem xét chứ không phải xem xét tất cả N. Khi được hỏi để tìm ra p khái niệm phù hợp nhất với Q ta sẽ phải tìm p tài liệu da 1 . da p như sau 1. Với mọi 1 i j p tính tương tự giữa vecQ và da i lớn hơn hay bằng tính tương tự giữa vecQ và da j và 2. không có tài liệu dz nào mà tính tương tự giữa dz và vecQ vượt quá tính tương tự của da p Điều này có thể thực hiện bằng sử dụng bất kỳ cấu trúc chỉ số hoá nào cho không gian R-d. Cấu trúc chỉ số hoá như vậy bao gồm cây R cây k-d như đã nghiên cứu trước đây. Tuy nhiên tổng quát thì cấu trúc chỉ số hóa như cây R và k-d không làm việc tốt với dữ liệu có số chiều 3 20. Do vậy cần phải có kỹ thuật nào đó tốt hơn. Cây TV TV-tree được mô tả sau đây là cấu trúc chỉ số hoá phù hợp hơn cho loại dữ liệu nhiều chiều này. Cây TV TV-tree Mục tiêu cơ bản của cây véctơ thu gọn TV-Telescopic Vector Tree là xâm nhập điểm dữ liệu trong không gian có số chiều rất lớn sao cho hiệu quả cao. Trên đây ta thấy tài liệu d được xem như véctơ d có độ dài k trong khi ma trận giá trị đơn sau khi phân chia có kích thước k x k . Do vậy mỗi tài liệu được xem như điểm trong không gian k chiều. Một CSDL tài liệu như mô tả trên đây được xem như tập hợp của các điểm như vậy và được chỉ số hoá phù hợp. Khi người sử dụng biểu diễn truy vấn Q thực tế là họ xác định véctơ vec Q có độ dài k. Ta phải tìm p tài liệu trong CSDL mà nó phù hợp nhất với Q. Có nghĩa rằng ta phải .

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.