Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Word Alignment for Languages with Scarce Resources Using Bilingual Corpora of Other Language Pairs"
TAILIEUCHUNG - Báo cáo khoa học: "Word Alignment for Languages with Scarce Resources Using Bilingual Corpora of Other Language Pairs"
This paper proposes an approach to improve word alignment for languages with scarce resources using bilingual corpora of other language pairs. To perform word alignment between languages L1 and L2, we introduce a third language L3. Although only small amounts of bilingual data are available for the desired language pair L1-L2, large-scale bilingual corpora in L1-L3 and L2-L3 are available. Based on these two additional corpora and with L3 as the pivot language, we build a word alignment model for L1 and L2. . | Word Alignment for Languages with Scarce Resources Using Bilingual Corpora of Other Language Pairs Haifeng Wang Hua Wu Zhanyi Liu Toshiba China Research and Development Center 5 F. Tower W2 Oriental Plaza East Chang An Ave. Dong Cheng District Beijing 100738 China wanghaifeng wuhua liuzhanyi @ Abstract This paper proposes an approach to improve word alignment for languages with scarce resources using bilingual corpora of other language pairs. To perform word alignment between languages L1 and L2 we introduce a third language L3. Although only small amounts of bilingual data are available for the desired language pair L1-L2 large-scale bilingual corpora in L1-L3 and L2-L3 are available. Based on these two additional corpora and with L3 as the pivot language we build a word alignment model for L1 and L2. This approach can build a word alignment model for two languages even if no bilingual corpus is available in this language pair. In addition we build another word alignment model for L1 and L2 using the small L1-L2 bilingual corpus. Then we interpolate the above two models to further improve word alignment between L1 and L2. Experimental results indicate a relative error rate reduction of as compared with the method only using the small bilingual corpus in L1 and L2. 1 Introduction Word alignment was first proposed as an intermediate result of statistical machine translation Brown et al. 1993 . Many researchers build alignment links with bilingual corpora Wu 1997 Och and Ney 2003 Cherry and Lin 2003 Zhang and Gildea 2005 . In order to achieve satisfactory results all of these methods require a large-scale bilingual corpus for training. When the large-scale bilingual corpus is unavailable some researchers acquired class-based alignment rules with existing dictionaries to improve word alignment Ker and Chang 1997 . Wu et al. 2005 used a large-scale bilingual corpus in general domain to improve domain-specific word alignment when only a .
Ngọc Vy
78
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Smaller Alignment Models for Better Translations: Unsupervised Word Alignment with the 0"
9
73
0
Báo cáo khoa học: "Alignment Model Adaptation for Domain-Specific Word Alignment"
8
60
0
Báo cáo khoa học: "Word Alignment Combination over Multiple Word Segmentation"
5
44
0
Báo cáo khoa học: "Bootstrapping Word Alignment via Word Packing"
8
42
0
A new feature to improve Moore’s sentence alignment method
13
65
0
Báo cáo khoa học: "Hierarchical Search for Word Alignment"
10
81
0
Báo cáo khoa học: "Diversify and Combine: Improving Word Alignment for Machine Translation on Low-Resource Languages"
5
72
0
Báo cáo khoa học: "Word Alignment with Synonym Regularization"
5
52
0
Báo cáo khoa học: "How Much Can We Gain from Supervised Word Alignment"
5
55
0
Báo cáo khoa học: "Active Learning-Based Elicitation for Semi-Supervised Word Alignment"
6
61
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462336
61
Giới thiệu :Lập trình mã nguồn mở
14
25915
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11335
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10543
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9835
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8885
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8499
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8098
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7709
1788
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7240
268
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Word Alignment
Languages with Scarce Resources
Bilingual Corpora of Other Language Pairs
báo cáo khoa học
mô hình ngôn ngữ
xử lý ngôn ngữ tự nhiên
Smaller Alignment Models for Better Translations
Unsupervised Word Alignment with the 0
Ashish Vaswani Liang Huang David Chiang
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
Alignment Model Adaptation
Domain Specific Word Alignment
WU Hua
Word Alignment Combination
Multiple Word Segmentation
Ning Xi
Guangchao Tang
Bootstrapping Word Alignment
Word Packing
Yanjun Ma
Nicolas Stroppa
Sentence alignment
Parallel corpora
word clustering
Natural language processing
Alignment algorithms
IBM model
Hierarchical Search
Long Papers
Diversify and Combine
Improving Word Alignment
Machine Translation
Low Resource Languages
Synonym Regularization
Hiroyuki Shindo
Supervised Word Alignment
Jinxi Xu and Jinying Chen
Active Learning Based Elicitation
Semi Supervised Word Alignment
Vamshi Ambati
Submodular Maximization over Matroids
Hui Lin
Dealing with Spurious Ambiguity
Learning ITG based Word Alignment
Stephan Vogel
Confidence Measure
Fei Huang
Unsupervised Word Alignment
Arbitrary Features
Chris Dyer Jonathan
An Algorithm
Unsupervised Transliteration Mining
Application to Word Alignment
Data Cleaning
Tsuyoshi Okita
Mining Parenthetical Translations
Web by Word Alignment
Dekang Lin
Discriminative Word Alignment
Conditional Random Fields
Phil Blunsom and Trevor Cohn
Improved Discriminative
Bilingual Word Alignment
Robert C
Moore Wen tau Yih
Word Alignment in English Hindi Parallel Corpus
Recency Vector Approach
Some Studies
Soft Syntactic Constraints
Discriminative Training
Semi Supervised Training
Statistical Word Alignment
Alexander Fraser
Yet Another Word Alignment Tool
Ulrich Germann
Optimizing Word Alignment Combination
Phrase Table Training
Yonggang Deng and Bowen Zhou
Finding Synonyms
Automatic Word Alignment
Measures of Distributional Similarity
TÀI LIỆU MỚI ĐĂNG
báo cáo hóa học:" Increased androgen receptor expression in serous carcinoma of the ovary is associated with an improved survival"
6
156
3
23-12-2024
Giáo trình phân tích phương trình vi phân viết dưới dạng thuật toán đặc tính của hệ thống p1
5
161
1
23-12-2024
Báo cáo nghiên cứu nông nghiệp " Field control of pest fruit flies in Vietnam "
14
189
4
23-12-2024
Chương 10: Các phương pháp tính quá trình quá độ trong mạch điện tuyến tính
57
232
7
23-12-2024
báo cáo hóa học:" Quality of data collection in a large HIV observational clinic database in sub-Saharan Africa: implications for clinical research and audit of care"
7
153
4
23-12-2024
báo cáo khoa học: "Malignant peripheral nerve sheath tumor arising from the greater omentum: Case report"
4
140
1
23-12-2024
IT Audit: EMC’s Journey to the Private Cloud
13
157
1
23-12-2024
Lập trình Java cơ bản : Luồng và xử lý file part 8
5
140
1
23-12-2024
Báo cáo khoa học: "A rare coexistence of adrenal cavernous hemangioma with extramedullar hemopoietic tissue: a case report and brief review of the literature"
4
106
0
23-12-2024
Business English Lesson – Advanced Level's archiveFinance (1)
8
113
0
23-12-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8098
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7709
1788
Ebook Chào con ba mẹ đã sẵn sàng
112
4406
1371
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6273
1266
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8885
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3835
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3917
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4700
565
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11335
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4501
490
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.