TAILIEUCHUNG - Thiết kế hệ thống công cụ tìm kiếm SEO hỗ trợ di động (Nguyễn Thanh Phong vs Nguyễn Ngọc Phượng) - 3

Xóa một tài liệu Tìm kiếm tài liệu dựa trên DOCID. Tác vụ tìm kiếm được thực hiện thường xuyên, nên cài index cho trường DOCID để tăng tốc độ tìm kiếm. . Cấu trúc từ điển chỉ mục Từ điển chỉ mục chứa danh sách các mục từ, hệ thống thực hiện yêu cầu tìm kiếm dựa trên các mục từ này. Số lượng từ trong tự điển rất lớn và tự điển thường xuyên được truy xuất nên cần phải có một cấu trúc hợp lý sao cho việc tìm kiếm một mục từ là nhanh nhất. Tự điển. | - Xóa một tài liệu - Tìm kiếm tài liệu dựa trên DOCID. Tác vụ tìm kiếm được thực hiện thường xuyên nên cài index cho trường DOCID để tăng tốc độ tìm kiếm. . Cấu trúc từ điển chỉ mục Từ điển chỉ mục chứa danh sách các mục từ hệ thống thực hiện yêu cầu tìm kiếm dựa trên các mục từ này. Số lượng từ trong tự điển rất lớn và tự điển thường xuyên được truy xuất nên cần phải có một cấu trúc hợp lý sao cho việc tìm kiếm một mục từ là nhanh nhất. Tự điển có thể tổ chức theo danh sách tuyến tính được sắp xếp của các mục từ và thực hiện tìm kiếm nhị phân. Tuy nhiên khi muốn thêm một mục từ vào cần phải sắp xếp lại tự điển điều này rất khó cho việc quản lý tự điển và chi phí tốn kém. Giải pháp là xây dựng tự điển thành cây n phân biến thể thành cây nhị phân để dễ dàng cho cài đặt và xử lý. Mỗi mục từ trong tự điển có một cấu trúc dữ liệu Info kèm theo được gắn vào ký tự cuối cùng của mục từ. Cấu trúc Info gồm các trườngsau struct Info int n int nDoc int signal int startPage int endPage Trong đó - n số lần xuất hiện của mục từ này trong danh sách các trang web mà hệ thống đã lập chỉ mục - nDoc số tài liệu có chứa mục từ này - signal xác định thuộc tính của mục từ này có giá trị 0 mục từ là từ tiếng Anh hoặc từ tiếng Việt giá trị 2 mục từ là từ stopword - 92 - - startPage trang bắt đầu trong chuỗi các trang trong file chỉ mục nghịch đảo thuộc về mục từ này - endPage trang cuối cùng trong danh sách các trang trong file chỉ mục nghịch đảo của mục từ này. Giá trị này sử dụng nhằm tăng tốc độ lập chỉ mục vì từ nó ta có thể truy xuất được đến trang cuối cùng nhanh nhất khi cần thêm tài liệu vào file nghịch đảo chứ không cần phải duyệt tuần tự danh sách các trang từ trang bắt đầu. Các thao tác chính trên tự điển gồm có - Thêm một mục từ - Xóa một mục từ - Tìm kiếm một mục từ - Cập nhật thông tin một mục Tự điển được nạp hoàn toàn vào hệ th . Cấu trúc tập tin chỉ mục nghịch đảo Tập tin nghịch đảo lưu trữ danh sách các tài liệu ứng với mục từ để cho hệ thống nhanh .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.