TAILIEUCHUNG - Đề tài khoa học và công nghệ cấp cơ sở: Nghiên cứu xây dựng cơ sở dữ liệu từ điển bằng phương pháp trích rút từ kho ngữ liệu

Mục tiêu nghiên cứu đề tài là nghiên cứu về từ điển, cơ sở dữ liệu từ điển, cấu trúc định dạng của các chuẩn dữ liệu từ điển; kho ngữ liệu, các loại kho ngữ liệu. Tìm ra giải pháp xây dựng cơ sở dữ liệu từ điển bằng cách trích rút từ các kho ngữ liệu. Từ đó, có thể làm nguồn dữ liệu cho các phần mềm từ điển, có thể nguồn cho các chương trình dịch tự động, trích rút thông tin tự động, tóm tắt văn bản tự động, | ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CAO ĐẲNG CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN BẰNG PHƯƠNG PHÁP TRÍCH RÚT DỮ LIỆU TỪ KHO NGỮ LIỆU Mã số T2016-07-03 Chủ nhiệm đề tài ThS. Trần Thị Kiều Đà Nẵng 12 2016 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CAO ĐẲNG CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ NGHIÊN CỨU XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN BẰNG PHƯƠNG PHÁP TRÍCH RÚT DỮ LIỆU TỪ KHO NGỮ LIỆU Mã số T2016-07-03 Chủ nhiệm đề tài ThS. Trần Thị Kiều Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài Đà Nẵng 12 2016 MỤC LỤC MỞ ĐẦU . 1 1. LÝ DO CHỌN ĐỀ TÀI .1 2. MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU .2 3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU .2 . Đối tượng nghiên cứu . 2 . Phạm vi nghiên cứu . 2 4. BỐ CỤC CỦA BÁO CÁO .2 CHƯƠNG 1 TỔNG QUAN . 4 . CƠ SỞ LÝ THUYẾT .4 . Tổng quan về từ điển . 4 . Cơ sở dữ liệu từ điển . 5 . Các chuẩn dữ liệu từ điển. 5 . Kho ngữ liệu . 9 . Các phương pháp tách từ tiếng Việt hiện nay . 11 . CÁC CÔNG TRÌNH NGHIÊN CỨU XÂY DỰNG TỪ ĐIỂN .11 . TỔNG KẾT CHƯƠNG 1 .12 CHƯƠNG 2 ĐỀ XUẤT GIẢI PHÁP XÂY DỰNG CƠ SỞ DỮ LIỆU TỪ ĐIỂN TỪ KHO NGỮ LIỆU . 13 . PHÁT BIỂU BÀI . ĐỀ XUẤT GIẢI PHÁP .14 . Mô hình bài toán . 14 . Đặc tả mô hình bài toán . 15 . LỰA CHỌN PHƯƠNG PHÁP KỸ . Phân đoạn từ trong tiếng Việt . 16 . Dịch máy thống kê . 18 . Định dạng dữ liệu từ điển . 20 . TỔNG KẾT CHƯƠNG 2 .20 CHƯƠNG 3 TRIỂN KHAI XÂY DỰNG VÀ THỰC NGHIỆM . 21 . TRIỂN KHAI ỨNG DỤNG .21 . Lựa chọn công nghệ . 21 . Chuẩn bị dữ liệu . 21 . Kết quả đạt được . 21 . Đánh giá kết quả . 25 . TỔNG KẾT CHƯƠNG 3 .25 DANH MỤC CÁC TỪ VIẾT TẮT STT Từ viết tắt Ý nghĩa 1 HTML HyperText Markup Language 2 CSDL Cơ sở dữ liệu 3 KDD Knowledge Discovery in Database 4 KPDL Khai phá dữ liệu 5 LRMM Left Right Maximum Matching 6 RLMM Right Left Maximum Matching 7 MMSEG Maximum Matching Segmentation 8 WFST Weighted .

TÀI LIỆU LIÊN QUAN
TÀI LIỆU MỚI ĐĂNG
10    177    3    22-12-2024
28    156    1    22-12-2024
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.