TAILIEUCHUNG - Tìm kiếm thông tin pháp luật tiếng Việt bằng truy vấn thông tin nhị phân

Bài viết trình bày việc tìm kiếm thông tin pháp luật tiếng Việt bằng truy vấn thông tin nhị phân. Để khắc phục các vấn đề trên nhóm đã áp dụng phương pháp Boolean retrieval để hỗ trợ việc tìm kiếm pháp luật một cách nhanh và chính xác hơn. | TÌM KIẾM THÔNG TIN PHÁP LUẬT TIẾNG VIỆT BẰNG TRUY VẤN THÔNG TIN NHỊ PHÂN Nguyễn Tiến Dũng Nguyễn Hoàng Long và Trương Triệu Thiên Khoa Công nghệ Thông tin Trường Đại học Công Nghệ TP. Hồ Chí Minh GVHD TS. Lê Thị Ngọc Thơ TÓM TẮT Hiện nay khi xã hội càng trở nên tiên tiến và con người càng dễ dàng tiếp cận với những tri thức khoa học hiện đại thì việc tìm kiếm thông tin là một nhu cầu không thể thiếu. Pháp luật cũng chính là một trong những chủ đề được rất nhiều người quan tâm. Luật pháp được vận dụng ngày càng phổ biến trong đời sống do tính quan trọng đến các vấn đề về xã hội và quyền lợi. Do đó các thông tin về pháp luật được mọi người tìm kiếm rất nhiều trên các trang mạng. Điều này có thể gây ra một số vấn đề như việc đưa sai thông tin pháp luật kết quả trả về chưa phù hợp với mong muốn của người dùng. Để khắc phục các vấn đề trên nhóm đã áp dụng phương pháp Boolean retrieval để hỗ trợ việc tìm kiếm pháp luật một cách nhanh và chính xác hơn. Từ khóa Boolean model full text search Information retrieval retrieval models truy hồi thông tin. 1. GIỚI THIỆU Hệ thống được tạo ra nhằm mục đích hỗ trợ người dùng tìm kiếm thông tin pháp luật một cách chính xác nhất có thể mà không cần hiểu biết nhiều về các từ khóa liên quan đến pháp luật. Khi sử dụng người dùng chỉ cần nhập câu truy vấn thì hệ thống sẽ trả về một danh sách kết quả được cho là phù hợp nhất với câu truy vấn ví dụ khi tìm kiếm thông tin về thiên tai Việt Nam thì hệ thống sẽ trả về các thông tin pháp luật liên quan nhất đến thiên tai như các công văn quyết định về phòng chống thiên tai cảnh báo về thiên tai quản lý rủi ro thiên tai . Hệ thống được nhóm xây dựng dựa trên thư viện Apache Lucene và dựa trên cơ sở lý thuyết của truy vấn thông tin nhị phân. Nhóm lựa chọn thư viện Lucene vì đây là thư viện hỗ trợ rất tốt cho một hệ thống truy hồi thông tin. Ngoài ra các văn bản pháp luật là dữ liệu nội bộ nên không thể đánh chỉ mục bằng google nên Lucene là sự lựa chọn phù hợp. Tuy nhiên Lucene được phát triển .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.