Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Công Nghệ Thông Tin
Kỹ thuật lập trình
Xây dựng mô hình và thuật toán hợp nhất dữ liệu từ điển phục vụ xử lý ngôn ngữ tự nhiên
TAILIEUCHUNG - Xây dựng mô hình và thuật toán hợp nhất dữ liệu từ điển phục vụ xử lý ngôn ngữ tự nhiên
Bài viết đề xuất giải pháp khai phá các nguồn dữ liệu từ điển đang tồn tại để xây dựng nguồn dữ liệu từ điển đồng nhất, có kích thước và số cặp ngôn ngữ lớn hơn nhằm phục vụ khai thác và sử dụng hiệu quả hơn. Giải pháp chúng tôi đề xuất trong phạm vi bài báo này dừng lại ở đề xuất mô hình toán học và thuật toán hợp nhất các từ điển để tạo nguồn dữ liệu từ điển lớn hơn về kích thước, đầy đủ hơn về nghĩa diễn giải và nhiều hơn về số cặp ngôn ngữ. | Huỳnh Công Pháp Cao Xuân Tuấn Nguyễn Văn Bình và Đinh Thị Mỹ Hạnh 215 Xây dựng mô hình và thuật toán hợp nhất dữ liệu từ điển phục vụ xử lý ngôn ngữ tự nhiên Huỳnh Công Pháp Cao Xuân Tuấn Nguyễn Văn Bình và Đinh Thị Mỹ Hạnh Khoa Công nghệ thông tin và Truyền thông Đại học Đà Nẵng hcphap@ nvbinh@ cxtuan@ dtmhanh@ Tóm tắt. Dữ liệu từ điển có vai trò quan trọng và được ứng dụng cho nhiều bài toán khác nhau trong lĩnh vực xử lý ngôn ngữ tự nhiên như dịch máy tìm kiếm tách từ gióng hàng. Tuy nhiên một trong những thực trạng hiện nay là các từ điển đang tồn tại rãi rác riêng biệt cấu trúc dữ liệu đa dạng kích thức nhỏ và số cặp ngôn ngữ hạn chế. Theo đó việc khai thác và sử dụng các từ điển hiện nay là chưa hiệu quả và còn gặp rất nhiều khó khăn. Người dùng có thể phải truy xuất nhiều từ điển đồng thời để có thể tra cứu cùng một từ hoặc tập hợp từ ở các lĩnh vực khác nhau. Trong bài báo này chúng tôi đề xuất giải pháp khai phá các nguồn dữ liệu từ điển đang tồn tại để xây dựng nguồn dữ liệu từ điển đồng nhất có kích thước và số cặp ngôn ngữ lớn hơn nhằm phục vụ khai thác và sử dụng hiệu quả hơn. Giải pháp chúng tôi đề xuất trong phạm vi bài báo này dừng lại ở đề xuất mô hình toán học và thuật toán hợp nhất các từ điển để tạo nguồn dữ liệu từ điển lớn hơn về kích thước đầy đủ hơn về nghĩa diễn giải và nhiều hơn về số cặp ngôn ngữ. Từ khóa Hợp nhất dữ liệu mô hình thuật toán hợp nhất dữ liệu từ điển đa ngữ hợp nhất từ điển khai phá dữ liệu văn bản. 1 Giới thiệu Dữ liệu luôn đóng vai trò quyết định đến chất lượng hoạt động của các công cụ và hệ thống xử lý ngôn ngữ tự nhiên. Dữ liệu trong lĩnh vực xử lý ngôn ngữ tự nhiên bao gồm các loại phổ biến như các kho ngữ liệu treebanks từ điển. Trong đó dữ liệu từ điển có vai trò rất quan trọng để phục vụ dịch tự động và phát triển các công cụ xử lý ngôn ngữ tự nhiên chẳng hạn như các công cụ hỗ trợ học tập tra cứu các công cụ tách từ dựa trên thuật toán maximum matching các công cụ gióng .
Nghĩa Dũng
81
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Bài giảng Báo cáo tài chính hợp nhất: Chương 2
135
58
2
Ebook Kế toán hợp nhất kinh doanh và hợp nhất báo cáo tài chính: Phần 1 - TS. Nguyễn Phú Giang
307
181
17
Ebook Kế toán hợp nhất kinh doanh và hợp nhất báo cáo tài chính: Phần 2 - TS. Nguyễn Phú Giang
316
204
10
Xây dựng mô hình và thuật toán hợp nhất dữ liệu từ điển phục vụ xử lý ngôn ngữ tự nhiên
8
63
3
Thuật toán bees giải bài toán cây steiner nhỏ nhất trong trường hợp đồ thị thưa
6
92
0
Độ phức tạp của thuật toán
4
50
0
Bài giảng Kế toán định giá - Chương 3: Kế toán định giá doanh nghiệp khi hợp nhất, cổ phần hóa doanh nghiệp
16
40
1
Luận án Tiến sĩ Khoa học máy tính: Một số phương pháp xử lý tri thức không nhất quán trong ontology
132
108
3
Nghiên cứu thuật toán và mô phỏng hợp nhất quỹ đạo bay trên tiêu đồ
9
85
0
Cải tiến toán tử đột biến trong thuật toán tiến hóa đa nhân tố giải bài toán cây khung phân cụm đường đi ngắn nhất
11
46
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462282
61
Giới thiệu :Lập trình mã nguồn mở
14
24823
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11280
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10506
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9784
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8876
1160
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8461
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8089
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7463
1763
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7184
268
TỪ KHÓA LIÊN QUAN
Kỹ thuật lập trình
Thuật toán hợp nhất dữ liệu
Xây dựng mô hình dữ liệu
Xử lý ngôn ngữ tự nhiên
Hợp nhất dữ liệu
Từ điển đa ngữ
Khai phá dữ liệu văn bản
Tạp chí Khoa học Công nghệ Hàng hải
Song song không đầy đủ
Phân cụm dữ liệu
Tính toán hợp nhất CUDA
Thuật toán FCM
Thuật toán phân cụm mờ FCM
lập trình máy tính
ngôn ngữ lập trình
thủ thuật lập trình
mẹo lập trình
Cấu trúc dữ liệu
bài toán khai phá dữ liệu
luận văn
thiết kế hệ thống
lập trình hệ thống
ứng dụng công nghệ thông tin
thiết bị cầm tay
khai phá dữ liệu
công nghệ khai phá dữ liệu
tin điện tử
Luận văn Thạc sĩ ngành Khoa học máy tính
Luận văn Thạc sĩ Kỹ thuật
Tóm tắt luận văn Thạc sĩ Kỹ thuật
Ứng dụng khai phá dữ liệu
Kỹ thuật khai phá văn bản
Phương pháp tách từ
Xây dựng các kho dữ liệu
lĩnh vực truyền thông xã hội
công cụ khai phá văn bản của SPSS
hệ quản trị cơ sở dữ liệu
lập trình XML
cơ sở dữ liệu nâng cao
Khai phá dữ liệu văn bản tiếng Việt
bản đồ tự tổ chức
hệ thống thông tin
kỹ thuật lập trình
lập trình ứng dụng
tóm tắt luận văn
luận văn thạc sĩ
luận văn kĩ thuật
phương pháp naise bayse
bóc lột thư giác tự động
Kỹ thuật phần mềm
Phân loại giới tính
Mạng xã hội
Tin nhắn văn bản
Quá trình khai phá dữ liệu
Công nghệ thông tin
Kỹ thuật khai phá dữ liệu
Phát hiện tri thức cơ bản
Cây quyết định
Luận văn Thạc sĩ Khoa học máy tính
Phương pháp cụm dữ liệu
Xây dựng bản đồ phân bố bệnh
Khai phá dữ liệu giáo dục
Phân loại văn bản
Xây dựng bộ dữ liệu cảm xúc
Mô hình học sâu
Xây dựng bộ dữ liệu UPT
Phân loại văn bản tiếng việt
Mô hình chủ đề
Lý thuyết Naive Bayes
Kỷ yếu hội thảo khoa học
Hội thảo khoa học Công nghệ thông tin
Phát hiện tin giả
Lập trình Python
Machine learning
PassiveAggression Classifier
TÀI LIỆU MỚI ĐĂNG
THE ANTHROPOLOGY OF ONLINE COMMUNITIES BY Samuel M.Wilson and Leighton C. Peterson
19
210
4
22-11-2024
B2B Content Marketing: 2012 Benchmarks, Budgets & Trends
17
213
3
22-11-2024
Đóng mới oto 8 chỗ ngồi part 9
10
171
3
22-11-2024
Báo cáo nghiên cứu nông nghiệp " Biofertiliser inoculant technology for the growth of rice in Vietnam: Developing technical infrastructure for quality assurance and village production for farmers "
12
132
2
22-11-2024
Chương 10: Các phương pháp tính quá trình quá độ trong mạch điện tuyến tính
57
225
7
22-11-2024
CHƯƠNG 2: RỦI RO THÂM HỤT TÀI KHÓA
28
152
1
22-11-2024
Sử dụng mô hình ARCH và GARCH để phân tích và dự báo về giá cổ phiếu trên thị trường chứng khoán
24
1064
2
22-11-2024
Word Games with English 1
65
129
1
22-11-2024
Báo cáo nghiên cứu khoa học " Sự nhất quán phát triển kinh tế thị trường XHCN trong xây dựng xã hội hài hoà của Trung Quốc và đổi mới của Việt Nam "
8
138
1
22-11-2024
CUỘC KHÁNG CHIẾN CHỐNG THỰC DÂN PHÁP KẾT THÚC (1953 - 1954)_5
11
133
1
22-11-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8089
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7463
1763
Ebook Chào con ba mẹ đã sẵn sàng
112
4364
1369
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6147
1258
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8876
1160
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3785
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3909
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4613
562
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11280
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4445
490
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.