Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Tham khảo luận văn - đề án 'luận văn:nghiên cứu xây dựng kho dữ liệu song ngữ phục vụ xử lý tiếng việt', luận văn - báo cáo, thạc sĩ - tiến sĩ - cao học phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả | BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG HOÀNG NHƯ QUỲNH NGHIÊN CỨU XÂY DỰNG KHO DỮ LIỆU SONG Ngữ PHỤC VỤ XỬ LÝ TIẾNG VIỆT CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH MÃ SỐ 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT ĐÀ NẴNG - NĂM 2011 Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học PGS.TS. Võ Trung Hùng Phản biện 1 GS.TS.Nguyễn Thanh Thủy Phản biện 2 PGS.TS.Tăng Tấn Chiến Luận văn sẽ được bảo vệ tại Hội đồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp tại Đại học Đà Nang ngày 10 và 11 tháng 8 năm 2011. Có thể tìm hiểu Luận văn tại - Trung tâm Thông tin - Học liệu Đại học Đà Nang - Trung tâm Học liệu Đại học Đà Nang - 1 - MỞ ĐẦU 1. Lý do chọn đề tài Với sự ra đời của máy tính điện tử và nhất là môi trường kết nối Internet toàn cầu đã tạo ra một lượng thông tin khổng lồ đặc biệt đa phần các dữ liệu đều là tiếng Anh. Tuy nhiên lượng thông tin to lớn này vẫn chưa được khai thác hết bởi nhiều lý do và một trong những lý do quan trọng đó là rào cản về ngôn ngữ. Vấn đề xử lý ngôn ngữ tự nhiên hiện nay rất cần các tài liệu song ngữ tuy nhiên các tài liệu thường nằm rải rác nhiều nơi dưới nhiều hình thức khác nhau. Do đó tất cả các tài liệu xử lý ngôn ngữ tự nhiên đều dựa vào kho dữ liệu song ngữ ví dụ như dịch tự động học tiếng Anh khai thác thông tin trên web .Vì vậy đòi hỏi một kho dữ liệu song ngữ rất lớn. Hiện nay trên thế giới có rất nhiều kho dữ liệu song ngữ như Anh - Pháp Pháp - Anh Anh - Hoa . Tuy nhiên đối với tiếng Việt hiện nay chưa có kho dữ liệu song ngữ nào như vậy được công bố chính thức và chia sẽ cho người sử dụng. Vấn đề đặt ra là làm thế nào để xây dựng được một kho dữ liệu song ngữ Anh - Việt từ các nguồn dữ liệu rải rác. Để góp phần giải quyết vấn đề trên chúng tôi đề xuất đề tài Nghiên cứu xây dựng kho dữ liệu song ngữ phục vụ xử lý tiếng Việt . 2. Mục tiêu nghiên cứu Mục tiêu chính mà đề tài hướng đến là nghiên cứu xây dựng kho dữ liệu chứa các cặp câu Anh - Việt từ các nguồn tài liệu khác nhau như trang web từ điển sách văn bản . dưới .