TAILIEUCHUNG - Tìm kiếm văn bản của DB2, Phần 2: Tìm hiểu về xử lý ngôn ngữ để tìm kiếm toàn văn bản trong DB2

Giới thiệu Tìm kiếm văn bản của DB2 cho phép tìm kiếm toàn văn bản trên dữ liệu có cấu trúc và không có cấu trúc được lưu trữ trong một cơ sở dữ liệu DB2. Nó dùng xử lý ngôn ngữ để xác định tập kết quả của một truy vấn tìm kiếm toàn văn bản. Tìm kiếm văn bản của DB2 có sẵn trên Bản vá lỗi 1 của Phiên bản của DB2 cho Linux®, UNIX® và Windows® (DB2 for Linux®, UNIX®, and Windows®, Version Fixpack 1) và mới hơn. Có thể tạo ra các chỉ. | Tìm kiếm văn bản của DB2 Phần 2 Tìm hiểu về xử lý ngôn ngữ để tìm kiếm toàn văn bản trong DB2 Giới thiệu Tìm kiếm văn bản của DB2 cho phép tìm kiếm toàn văn bản trên dữ liệu có cấu trúc và không có cấu trúc được lưu trữ trong một cơ sở dữ liệu DB2. Nó dùng xử lý ngôn ngữ để xác định tập kết quả của một truy vấn tìm kiếm toàn văn bản. Tìm kiếm văn bản của DB2 có sẵn trên Bản vá lỗi 1 của Phiên bản của DB2 cho Linux UNIX và Windows DB2 for Linux UNIX and Windows Version Fixpack 1 và mới hơn. Có thể tạo ra các chỉ mục văn bản dựa trên một loạt các kiểu dữ liệu từ các VARCHAR nhỏ đến các BLOB lớn có chứa các đối tượng văn bản. Trong bối cảnh về xử lý chỉ mục của Tìm kiếm văn bản của DB2 với mỗi hàng nội dung của mỗi cột được xử lý như một tài liệu. Tùy thuộc vào kiểu tài liệu được định nghĩa theo định dạng chỉ mục văn bản các trình xử lý tiếp nhận và các trình phân tích cú pháp khác nhau được sử dụng để trích xuất và lọc văn bản. Ví dụ một tài liệu XML có thể được tạo chỉ mục hoặc theo định dạng XML hay theo định dạng TEXT văn bản . Nếu dùng định dạng XML một trình phân tích cú pháp XML sẽ được sử dụng để phân tích cú pháp và tạo chỉ mục tài liệu và cả hai cú pháp truy vấn SQL và cú pháp giống như-XPath có thể được sử dụng để truy vấn. Trong trường hợp này có thể sử dụng các phần tử cấu trúc để xác định phần văn bản cần được tìm kiếm nhưng chính các phần tử cấu trúc lại không phải là một phần thân văn bản có thể tìm kiếm được. Mặt khác với định dạng TEXT một trình phân tích cú pháp văn bản-thuần được sử dụng để phân tích và tạo chỉ mục tài liệu. Trong trường hợp này các phần tử cấu trúc được coi là một phần thân văn bản có thể tìm kiếm được và chỉ có cú pháp truy vấn SQL được áp dụng. Hình 1 cho thấy luồng công việc cơ bản. Tìm kiếm văn bản của DB2 phụ thuộc vào IBM LanguageWare để phân tích từ vựng. Tìm kiếm văn bản của DB2 sử dụng một cách tiếp cận dựa trên-từ điển cho các ngôn ngữ được hỗ trợ. Còn với các ngôn ngữ khác nó sử dụng một cách tiếp cận xử lý-ký .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.