TAILIEUCHUNG - Tìm kiếm câu hỏi có ý nghĩa từ các trang web hỏi đáp cộng đồng

Nghiên cứu thực hiện trích rút những đặc trưng quan trọng từ mỗi luồng hỏi - đáp cũng như thông tin của người sử dụng và xây dựng mô hình phân loại để xác định được những câu hỏi có ý nghĩa. Các thực nghiệm được xây dựng trên tập dữ liệu trích rút từ trang web hỏi đáp cộng đồng Yahoo! Answer đã chỉ ra tính hiệu quả của phương pháp đề xuất. | TẠP CHÍ KHOA HỌC Khoa học Tự nhiên và Công nghệ, Số 10 (9/2017) tr 104 - 113 TÌM KIẾM CÂU HỎI CÓ Ý NGHĨA TỪ CÁC TRANG WEB HỎI ĐÁP CỘNG ĐỒNG Nguyễn Văn Tú, Hoàng Thị Lam, Nguyễn Thị Thanh Hà13 Trường Đại học Tây Bắc Tóm tắt: Các trang web hỏi đáp cộng đồng có chứa một lượng lớn thông tin hỏi - đáp có giá trị sinh ra bởi những người sử dụng. Trong các trang web hỏi đáp cộng đồng, người dùng có thể gửi các câu hỏi, trả lời các câu hỏi của người khác và cung cấp thông tin phản hồi cho những câu hỏi/câu trả lời. Trong nghiên cứu này chúng tôi sử dụng tiếp cận học máy nhằm tìm kiếm những câu hỏi có ý nghĩa từ các trang web hỏi đáp cộng đồng. Những câu hỏi này cùng với các câu trả lời tốt nhất của chúng sẽ là nguồn dữ liệu quan trọng cho xây dựng cơ sở tri thức, truy hồi thông tin và hỏi đáp non - factiod. Nghiên cứu thực hiện trích rút những đặc trưng quan trọng từ mỗi luồng hỏi - đáp cũng như thông tin của người sử dụng và xây dựng mô hình phân loại để xác định được những câu hỏi có ý nghĩa. Các thực nghiệm được xây dựng trên tập dữ liệu trích rút từ trang web hỏi đáp cộng đồng Yahoo! Answer đã chỉ ra tính hiệu quả của phương pháp đề xuất của chúng tôi. Từ khóa: Hỏi đáp cộng đồng, hỏi đáp tự động, phân loại, support vector machine. 1. Tổng quan Trong lĩnh vực xử lý ngôn ngữ tự nhiên và truy xuất thông tin, vấn đề hỏi - đáp đã thu hút nhiều sự chú ý trong những năm qua. Tuy nhiên, các nghiên cứu về hỏi - đáp chủ yếu tập trung vào việc tìm câu trả lời chính xác cho câu hỏi factoid được trích rút từ các tài liệu liên quan. Đánh giá nổi tiếng nhất về nhiệm vụ hỏi - đáp factoid là hội nghị truy hồi văn bản (Text REtrieval Conference-TREC(1)). Các câu hỏi và câu trả lời được phát hành bởi TREC đã trở thành nguồn dữ liệu quan trọng cho các nhà nghiên cứu trong việc nghiên cứu xây dựng các hệ thống hỏi đáp tự động [10]. Tuy nhiên, khi phải đối mặt với các câu hỏi non - factoid như các câu hỏi về lý do tại sao, như thế nào, hầu như không có hệ thống hỏi đáp tự động nào làm .

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.