TAILIEUCHUNG - Tóm tắt Luận án Tiến sĩ Lhoa học máy tính: Khai phá tri thức song ngữ và ứng dụng trong dịch máy Anh - Việt

Luận án được tổ chức thành 4 chương: Chương 1/ Giới thiệu tổng quan về các vấn đề nghiên cứu trong luận án. Chương 2/ Trình bày nội dung, kết quả nghiên cứu về xây dựng ngữ liệu song ngữ cho dịch máy thống kê. Chương 3/ Trình bày nội dung, kết quả nghiên cứu về một số cải tiến mô hình IBM để gióng hàng từ cho dịch máy thống kê. Chương 4/ Trình bày nội dung, kết quả nghiên cứu về xác định cụm từ song ngữ cho dịch máy thống kê. | ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ QUANG HÙNG KHAI PHÁ TRI THỨC SONG NGỮ VÀ ỨNG DỤNG TRONG DỊCH MÁY ANH – VIỆT Chuyên ngành: Khoa học máy tính Mã số: 62 48 01 01 TÓM TẮT LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Hà Nội - 2016 Hà Nội – 2014 Công trình được hoàn thành tại: Trường Đa ̣i ho ̣c Công nghê ̣ , Đa ̣i ho ̣c Quố c gia Hà Nô ̣i. Người hướng dẫn khoa học: 1. . Lê Anh Cường 2. . Huỳnh Văn Nam Phản biện 1: . Nguyễn Kim Anh Phản biện 2: TS. Nguyễn Đức Dũng Phản biện 3: TS. Lê Hồng Phương Luận án đã được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp tại Trường Đa ̣i ho ̣c Công nghê ̣ , Đại học Quốc gia Hà Nội vào hồi 9 giờ ngày 12 tháng 01 năm 2016. Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam - Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội Mở đầu 1. Tính cấp thiết của luận án Ý tưởng về dịch máy (machine translation - MT) ra đời từ năm 1949. Từ đó đến nay, sau hơn 60 năm nghiên cứu và phát triển, các dịch vụ dịch máy bây giờ đã trở nên phổ biến rộng rãi. Hiện nay, dịch máy dựa trên cách tiếp cận thống kê đang là một hướng phát triển đầy tiềm năng bởi những ưu điểm vượt trội so với các cách tiếp cận khác. Đối với một hệ thống dịch máy thống kê (statistical machine translation - SMT), chất lượng dịch tỷ lệ thuận với số lượng và chất lượng của ngữ liệu song ngữ được sử dụng để xây dựng hệ thống dịch. Tuy nhiên, ngữ liệu song ngữ hiện vẫn còn hạn chế cả về kích thước lẫn chất lượng, ngay cả đối với các ngôn ngữ chính. Ngoài ra, đối với các cặp ngôn ngữ có nhiều khác biệt về cấu trúc ngữ pháp (ví dụ, Anh - Việt), vấn đề về chất lượng dịch đang là thách thức đối với các nhà nghiên cứu về dịch máy trong nhiều năm qua. Vì vậy, các nghiên cứu nhằm khai thác thêm ngữ liệu song ngữ và phát triển các phương pháp hiệu quả hơn dựa trên ngữ liệu hiện có để tăng chất lượng dịch cho SMT là những vấn đề cấp thiết và mang tính thời sự trong lĩnh vực xử lý ngôn ngữ tự nhiên hiện nay. Điều này

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.