TAILIEUCHUNG - Trích rút quan hệ giữa các thực thể từ văn bản tiếng Việt sử dụng phương pháp lan truyền nhãn

Bài báo đề xuất việc xây dựng hệ thống trích rút quan hệ giữa các thực thể từ văn bản tiếng Việt sử dụng phương pháp lan truyền nhãn. Các đóng góp chính là: Đề xuất các phương pháp đo độ tương đồng giữa các câu; và đề xuất phương pháp giảm ảnh hưởng của các nhãn có tần suất xuất hiện lớn đến quá trình lan truyền nhãn. | Tạp chí Tin học và Điều khiển học, , (2014), 15–27 TRÍCH RÚT QUAN HỆ GIỮA CÁC THỰC THỂ TỪ VĂN BẢN TIẾNG VIỆT SỬ DỤNG PHƯƠNG PHÁP LAN TRUYỀN NHÃN LÊ THANH HƯƠNG1 , SAM CHANRATHANY1 , NGUYỄN THANH THUỶ2 , NGUYỄN THÀNH LONG1 , TRỊNH MINH DŨNG1 1 Viện Công nghệ Thông tin và Truyền thông, ĐH Bách khoa Hà Nội 2 Khoa CNTT, Trường ĐH Công nghệ, ĐHQG Hà Nội Tóm t t. Bài báo đề xuất việc xây dựng hệ thống trích rút quan hệ giữa các thực thể từ văn bản tiếng Việt sử dụng phương pháp lan truyền nhãn. Các đóng góp chính là: (i) đề xuất các phương pháp đo độ tương đồng giữa các câu; và (ii) đề xuất phương pháp giảm ảnh hưởng của các nhãn có tần suất xuất hiện lớn đến quá trình lan truyền nhãn. Thử nghiệm cho thấy phương pháp giảm ảnh hưởng của các nhãn có tần suất xuất hiện lớn cho kết quả tốt hơn đáng kể phương pháp lan truyền nhãn gốc [10]. Ngoài ra, khi sử dụng cùng dữ liệu huấn luyện nhỏ phương pháp lan truyền nhãn tốt hơn phương pháp SVM. T khóa. Trích rút mối quan hệ, lan truyền nhãn, học bán giám sát. Abstract. This paper presents a relation extraction system for Vietnamese texts using label propagation. In this paper, we propose: (i) a measure of similarities between two sentences; (ii) a method to decrease the effect of high frequency labels in the documents. Our experimental results show that proposed label propagation method achieves a higher accuracy than the ordinary one [10]. Moreover, its accuracy is also higher than the support vector machine method applied. Key words. Relation extraction, labeled propagation, semi supervised learning. 1. MỞ ĐẦU Trích rút mối quan hệ giữa các thực thể (Relation Extraction - RE) là công việc xác định quan hệ giữa các cặp thực thể trong văn bản. Ví dụ, quan hệ sống ở hai thực thể “ tên người ” và “ tên địa điểm ”, quan hệ họ hang giữa hai thực thể “ tên người ” và “tên người”. Trong hơn một thập niên qua, đã có nhiều nghiên cứu về trích rút quan hệ giữa các thực thể [1, 3, 6, 9, 12]. Các nghiên cứu được chia thành

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.