TAILIEUCHUNG - Phân loại câu hỏi kiểu what sử dụng nhiều loại đặc trưng

Bài viết đề xuất việc trích rút các đặc trưng phù hợp nhằm phân loại câu hỏi What đạt độ chính xác cao. Chúng tôi cũng đề xuất sử dụng mẫu câu hỏi như là một đặc trưng mới để kết hợp với các đặc trưng khác trong phân loại câu hỏi. Chúng tôi đã kiểm tra những đề xuất của mình bằng cách sử dụng bộ phân loại Support Vector Machine trên bộ dữ liệu TREC và đã đạt được độ chính xác phân loại câu hỏi What cao hơn so với những nghiên cứu trước đó trên cùng nguyên tắc phân loại và tập dữ liệu. | TẠP CHÍ KHOA HỌC Khoa học Tự nhiên và Công nghệ Số 6 9 2016 tr 81 - 89 PHÂN LOẠI CÂU HỎI KIỂU WHAT SỬ DỤNG NHIỀU LOẠI ĐẶC TRƯNG Nguyễn Văn Tú Khoa Toán - Lý - Tin Trường Đại học Tây Bắc Tóm tắt Phân loại câu hỏi là một thành phần quan trọng trong các hệ thống hỏi đáp tự động. Nhiệm vụ chính của phân loại câu hỏi là dự báo kiểu thực thể của câu trả lời của các câu hỏi viết bằng ngôn ngữ tự nhiên. Trong các hệ thống hỏi đáp tự động các câu hỏi với từ để hỏi What chiếm phần lớn nhưng việc phân loại các câu hỏi này lại có nhiều khó khăn hơn so với việc phân loại các câu hỏi khác. Trong bài báo này chúng tôi đề xuất việc trích rút các đặc trưng phù hợp nhằm phân loại câu hỏi What đạt độ chính xác cao. Chúng tôi cũng đề xuất sử dụng mâu câu hỏi như là một đặc trưng mới để kết hợp với các đặc trưng khác trong phân loại câu hỏi. Chúng tôi đã kiểm tra những đề xuất của mình bằng cách sử dụng bộ phân loại Support Vector Machine trên bộ dữ liệu TREC và đã đạt được độ chính xác phân loại câu hỏi What cao hơn so với những nghiên cứu trước đó trên cùng nguyên tắc phân loại và tập dữ liệu. Từ khóa Phân loại câu hỏi hệ thống hỏi đáp mâu câu hỏi máy hô trợ vectơ. 1. Tổng quan Hệ thống hỏi đáp tự động đã trở thành hướng nghiên cứu quan trọng trong xử lý ngôn ngữ tự nhiên 4 9 . Mục đích của các hệ thống hỏi đáp tự động là tìm kiếm câu trả lời chính xác và ngắn gọn cho những câu hỏi viết bằng ngôn ngữ tự nhiên thay vì trả về một danh sách các tài liệu liên quan đến câu hỏi như trong các máy tìm kiếm. Phân loại câu hỏi là một thành phần quan trọng trong các hệ thống hỏi đáp tự động. Nhiệm vụ chính của phân loại câu hỏi là dự báo kiểu thực thể của câu trả lời của các câu hỏi viết bằng ngôn ngữ tự nhiên. Có nhiều cách tiếp cận khác nhau để phân loại câu hỏi như tiếp cận dựa trên luật 2 3 tiếp cận dựa trên học máy 1 7 10 . Trong nghiên cứu của mình chúng tôi sử dụng tiếp cận dựa trên học máy với việc sử dụng nhiều đặc trưng và sử dụng mẫu câu hỏi Question pattern như là một đặc trưng mới

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.