TAILIEUCHUNG - Mở rộng kho ngữ liệu dịch tự động theo hướng ngữ nghĩa

Bài viết Mở rộng kho ngữ liệu dịch tự động theo hướng ngữ nghĩa đề xuất mở rộng kho ngữ liệu dịch tự động theo hướng ngữ nghĩa bằng cách thêm tầng ngữ nghĩa vào các kho ngữ liệu hiện tại nhằm nâng cao hiệu quả của các hệ thống khai thác dịch tự động hiện nay. | TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG - SỐ 12 73 .2013 Quyển 2 MỞ RỘNG KHO NGỮ LIỆU DỊCH TỰ ĐỘNG THEO HƯỚNG NGỮ NGHĨA SEMANTIC ORIENTED EXTENSION FOR MACHINE TRANSLATION CORPORA Đặng Đại Thọ Huỳnh Công Pháp Trường Cao đẳng Công nghệ Thông tin Đại học Đà Nẵng Email hcphap@ TÓM TẮT Kho ngữ liệu là tài nguyên ngôn ngữ căn bản và rất cần thiết để phát triển và cải tiến các hệ thống dịch tự động. Hiện nay đã tồn tạị rất nhiều kho ngữ liệu dùng cho dịch tự động. Tuy nhiên việc khai thác chúng còn rất nhiều hạn chế. Nguyên nhân là các kho ngữ liệu dịch tự động hiện nay chủ yếu tồn tại dưới dạng văn bản hoặc có liên kết các dạng dữ liệu khác như âm thanh hình ảnh đồ thị mà chưa được tổ chức ở dạng ngữ nghĩa. Vì thế trong bài báo này chúng tôi đề xuất mở rộng kho ngữ liệu dịch tự động theo hướng ngữ nghĩa bằng cách thêm tầng ngữ nghĩa vào các kho ngữ liệu hiện tại nhằm nâng cao hiệu quả của các hệ thống khai thác dịch tự động hiện nay. Từ khóa kho ngữ liệu dịch tự động ngữ nghĩa hệ thống khai thác mở rộng kho ngữ liệu ABSTRACT Corpora play a crucial role in the development and improvement of automatic translation systems. There are currently many corpora used in the machine translation MT domain. However exploiting and using these corpora are still challenging and limited because of some reasons of which the main reason is that most corpora are in terms of raw texts or linked to other different kinds of data such as audio images graphs. But they are not organized into semantic layers. Therefore in this paper we want to propose an idea of extending and enlarging corpora by adding to them a semantic layer so that the performance of corpus exploitation systems will be much improved. Key words corpus machine translation semantic exploitation system corpus extension Bất cứ hệ thống dịch tự động hay hệ thống 1. Đặt vấn đề khai thác kho ngữ liệu thuộc loại nào cũng đều Dữ liệu dịch tự động còn gọi là kho ngữ có một quá trình tìm kiếm và so khớp

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.