TAILIEUCHUNG - Nhận dạng thực thể định danh trong văn bản tiếng Việt

Bài báo giới thiệu hệ thống nhận dạng thực thể định danh trong văn bản tiếng Việt dựa trên tập luật. Luật được xây dựng để tìm kiếm các mẫu qua quá trình so khớp. Các thực thể trong mẫu sau đó sẽ được phân loại vào từng lớp cụ thể dựa vào thông tin ngữ cảnh mà mẫu cung cấp. Kết quả thực nghiệm của hệ thống là tương đối khả quan với độ đo F đạt 80,64%. | NHẬN DẠNG THỰC THỂ ĐỊNH DANH TRONG VĂN BẢN TIẾNG VIỆT NGUYỄN LÊ TRUNG THÀNH Trường Đại học Sư phạm – Đại học Huế ĐT: 0902 615 658, Email: nguyenthanh224@ Tóm tắt: Nhận dạng thực thể định danh là bài toán xác định lớp của các thực thể trong văn bản (thực thể chỉ tên người, tên tổ chức, tên địa điểm,). Nhận dạng thực thể định danh là bài toán cơ bản trong nhiều vấn đề của xử lý ngôn ngữ tự nhiên như truy vấn thông tin, trích xuất thông tin, dịch máy, hệ thống hỏi đáp, tóm tắt văn bản tự động. Bài báo giới thiệu hệ thống nhận dạng thực thể định danh trong văn bản tiếng Việt dựa trên tập luật. Luật được xây dựng để tìm kiếm các mẫu qua quá trình so khớp. Các thực thể trong mẫu sau đó sẽ được phân loại vào từng lớp cụ thể dựa vào thông tin ngữ cảnh mà mẫu cung cấp. Kết quả thực nghiệm của hệ thống là tương đối khả quan với độ đo F đạt 80,64%. Từ khóa: nhận dạng thực thể định danh, hệ thống nhận dạng dựa trên tập luật, xử lý ngôn ngữ tự nhiên, văn bản tiếng Việt. 1. GIỚI THIỆU Nhận dạng thực thể định danh là bài toán cơ bản và quan trọng trong xử lý ngôn ngữ tự nhiên. Nhận dạng thực thể định danh bao gồm xác định và phân loại các thực thể trong văn bản vào các lớp gồm lớp Người, Tổ chức, Địa điểm và lớp Khác (các thực thể không thuộc ba lớp trên). Kết quả của quá trình nhận dạng thực thể định danh được sử dụng trong nhiều lĩnh vực như truy vấn thông tin, trích xuất thông tin, dịch máy, hệ thống hỏi đáp, tóm tắt văn bản. Bài báo này giới thiệu hệ thống nhận dạng thực thể định danh tiếng Việt dựa trên tập luật. Phần 2 đề cập đến các nghiên cứu liên quan. Phần 3 mô tả cách xây dựng hệ thống nhận dạng thực thể định danh dựa trên tập luật và trình bày về tập luật mà tác giả xây dựng được. Thực nghiệm trên hệ thống và hiệu quả được đánh giá ở phần 4. Phần 5 trình bày kết luận và các hướng phát triển tiếp trong tương lai. 2. CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN Nhiều nghiên cứu về nhận dạng thực thể định danh được thực hiện với các cách tiếp cận khác nhau. Có thể .

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.