TAILIEUCHUNG - Đánh giá vai trò của kho ngữ liệu đối với chất lượng dịch tự động tiếng Việt

Bài viết Đánh giá vai trò của kho ngữ liệu đối với chất lượng dịch tự động tiếng Việt tiến hành nghiên cứu thực trạng của các kho ngữ liệu song ngữ tiếng Việt hiện nay và tổ chức xây dựng các hệ thống dịch Anh-Việt từ các kho ngữ liệu có kích thước khác nhau, sử dụng các phương pháp dịch khác nhau. Kết quả đánh giá chất lượng của các hệ thống dịch thu được cho thấy, khi sử dụng kho ngữ liệu có kích thước càng lớn thì chất lượng của hệ thống dịch càng tăng. | ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ - ĐẠI HỌC ĐÀ NẴNG VOL. 19 NO. 1 2021 47 ĐÁNH GIÁ VAI TRÒ CỦA KHO NGỮ LIỆU ĐỐI VỚI CHẤT LƯỢNG DỊCH TỰ ĐỘNG TIẾNG VIỆT EVALUATION OF THE ROLE OF CORPUS IN VIETNAMESE-RELATED MACHINE TRANSLATION QUALITY Nguyễn Văn Bình1 Huỳnh Công Pháp1 1 Trường Đại học Công nghệ Thông tin và Truyền thông Việt-Hàn - Đại học Đà Nẵng nvbinh@ hcphap@ Nhận bài 30 11 2020 Chấp nhận đăng 10 01 2021 Tóm tắt - Chất lượng của các hệ thống dịch tự động tiếng Việt hiện Abstract - The quality of current Vietnamese-related automatic nay vẫn còn thấp khi so sánh với chất lượng dịch của các cặp ngôn translation systems is still low when compared with the translation ngữ phổ biến khác. Có nhiều yếu tố ảnh hưởng đến chất lượng của quality of other popular language pairs. There are many factors that mô hình dịch trong đó có phương pháp dịch và kho ngữ liệu. Để xây affect the quality of the translation model including the translation dựng một hệ thống dịch có chất lượng tốt cần sử dụng kho ngữ liệu method and the corpus. To build a good quality translation system it tốt về chất lượng và có số lượng lớn. Bài báo này tiến hành nghiên is necessary to use good quality and large quantity of linguistic cứu thực trạng của các kho ngữ liệu song ngữ tiếng Việt hiện nay và resources. This article researches the current situation of Vietnamese tổ chức xây dựng các hệ thống dịch Anh-Việt từ các kho ngữ liệu có bilingual corpus and builds the English-Vietnamese translation kích thước khác nhau sử dụng các phương pháp dịch khác nhau. Kết systems from corpus of different sizes using other translation quả đánh giá chất lượng của các hệ thống dịch thu được cho thấy khi methods. The results of the quality of the translation systems obtained sử dụng kho ngữ liệu có kích thước càng lớn thì chất lượng của hệ show that when using the larger corpus size the quality of the thống dịch càng tăng. translation system is increased. Từ khóa - Dịch tự động kho ngữ .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.