TAILIEUCHUNG - Phát triển hệ truy hồi thông tin tiếng Việt dựa trên mã nguồn mở

Các hệ truy hồi thông tin hiện nay vẫn còn trả về kết quả không như mong muốn của người dùng và hỗ trợ tốt cho tiếng Anh; riêng với tiếng Việt thì các hệ này vẫn còn ít và không được công bố rộng rãi các mã nguồn. Bài báo trình bày cách phát triển hệ một truy hồi thông tin tiếng Việt dựa trên mã nguồn mở Lucene và cách xây dựng công cụ VietAnalyzer hỗ trợ xử lí tiếng Việt. | JOURNAL OF SCIENCE OF HNUE Interdisciplinary Science 2013 Vol. 58 No. 1 pp. 37-45 This paper is available online at http PHÁT TRIỂN HỆ TRUY HỒI THÔNG TIN TIẾNG VIỆT DỰA TRÊN MÃ NGUỒN MỞ Trần Anh Tuấn và Đào Thị Thanh Loan Khoa Ngoại ngữ - Tin học Trường Cao đẳng Sư phạm Đắk Lắk Tóm tắt. Hệ truy hồi thông tin có kết quả trả về càng gần với câu truy vấn của người dùng đưa vào thì càng có độ tin cậy cao. Tuy nhiên các hệ truy hồi thông tin hiện nay vẫn còn trả về kết quả không như mong muốn của người dùng và hỗ trợ tốt cho tiếng Anh riêng với tiếng Việt thì các hệ này vẫn còn ít và không được công bố rộng rãi các mã nguồn. Bài báo trình bày cách phát triển hệ một truy hồi thông tin tiếng Việt dựa trên mã nguồn mở Lucene và cách xây dựng công cụ VietAnalyzer hỗ trợ xử lí tiếng Việt. Từ khóa Hệ truy hồi thông tin tiếng Việt vnIR VietAnalyzer. 1. Mở đầu Với sự phát triển nhanh chóng của internet đặc biệt là world wide web giúp cho người dùng chia sẻ các thông tin với nhau dễ dàng hơn. Các trang web được phân bố hầu hết ở tất cả các quốc gia mà hầu hết các trang web gần như là thông tin ở dạng văn bản. Mỗi tài liệu thông tin có ngôn ngữ văn phong từ vựng khác nhau phụ thuộc vào nguồn gốc quốc gia ngôn ngữ tác giả . vì thế có thể nói thông tin trong thế giới world wide web là rất phong phú và đa dạng. Chính sự phát triển mạnh mẽ và đa dạng này đã gây khó khăn cho người dùng trong việc tìm kiếm thông tin liên quan đến lĩnh vực cần tìm. Để đáp ứng được nhu cầu tìm kiếm thông tin liên quan đến lĩnh vực cần tìm của người dùng trong kho thông tin khổng lồ phong phú và đa dạng thì cần phải có một công cụ trợ giúp người dùng trong quá trình tìm kiếm. Công cụ hỗ trợ người dùng trong quá trình tìm kiếm đó chính là các máy tìm kiếm search engine . Hiện nay các máy tìm kiếm được phát triển nhằm hỗ trợ người dùng trong quá trình tìm kiếm thông tin như Google Yahoo . Các máy tìm kiếm này đã và đang hỗ trợ đắc lực trong việc tìm kiếm thông tin người dùng quan tâm và .

TỪ KHÓA LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
28    169    1    28-01-2025
337    152    2    28-01-2025
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.