Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "An Algorithm for Unsupervised Transliteration Mining with an Application to Word Alignment"
TAILIEUCHUNG - Báo cáo khoa học: "An Algorithm for Unsupervised Transliteration Mining with an Application to Word Alignment"
We propose a language-independent method for the automatic extraction of transliteration pairs from parallel corpora. In contrast to previous work, our method uses no form of supervision, and does not require linguistically informed preprocessing. We conduct experiments on data sets from the NEWS 2010 shared task on transliteration mining and achieve an F-measure of up to 92%, outperforming most of the semi-supervised systems that were submitted. | An Algorithm for Unsupervised Transliteration Mining with an Application to Word Alignment Hassan Sajjad Alexander Fraser Helmut Schmid Institute for Natural Language Processing University of Stuttgart sajjad fraser schmid @ Abstract We propose a language-independent method for the automatic extraction of transliteration pairs from parallel corpora. In contrast to previous work our method uses no form of supervision and does not require linguistically informed preprocessing. We conduct experiments on data sets from the NEWS 2010 shared task on transliteration mining and achieve an F-measure of up to 92 outperforming most of the semi-supervised systems that were submitted. We also apply our method to English Hindi and English Arabic parallel corpora and compare the results with manually built gold standards which mark transliterated word pairs. Finally we integrate the transliteration module into the GIZA word aligner and evaluate it on two word alignment tasks achieving improvements in both precision and recall measured against gold standard word alignments. 1 Introduction Most previous methods for building transliteration systems were supervised requiring either handcrafted rules or a clean list of transliteration pairs both of which are expensive to create. Such resources are also not applicable to other language pairs. In this paper we show that it is possible to extract transliteration pairs from a parallel corpus using an unsupervised method. We first align a bilingual corpus at the word level using GIZA and create a list of word pairs containing a mix of nontransliterations and transliterations. We train a sta 430 tistical transliterator on the list of word pairs. We then filter out a few word pairs those which have the lowest transliteration probabilities according to the trained transliteration system which are likely to be non-transliterations. We retrain the translitera-tor on the filtered data set. This process is iterated filtering .
Mạnh Hùng
58
10
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Solving uncapacitated multiple allocation p-hub center problem by Dijkstra’s algorithm-based genetic algorithm and simulated annealing
14
63
0
Lecture Algorithm design - Chapter 6: Dynamic programming II
50
62
0
Computer Security: Chapter 9 - Role-Based Access Control (RBAC) Role Classification Algorithm
12
101
0
Lecture Algorithm design - Chapter 2: Algorithm analysis
26
55
0
Lecture Algorithm design - Chapter 4: Greedy Algorithms II
64
71
0
Lecture Algorithm design - Chapter 7: Network flow I
87
74
0
Anomaly detection using genetic with SVM algorithm in data mining
8
74
0
Optimization of machining processes using pattern search algorithm
12
66
0
Lecture Data Structure and Algorithm - Week 6: Sorting Algorithm
68
23
3
Lectures on the NTRU encryption algorithm and digital signature scheme
31
57
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461844
55
Giới thiệu :Lập trình mã nguồn mở
14
22508
57
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10861
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10024
445
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9488
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8241
1124
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8199
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7859
2219
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6639
253
Vật lý hạt cơ bản (1)
29
5753
85
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
An Algorithm
Unsupervised Transliteration Mining
Application to Word Alignment
báo cáo khoa học
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
Solving uncapacitated multiple allocation p hub center problem
Dijkstra’s algorithm based genetic algorithm and simulated annealing
Dijkstra’s algorithm based genetic algorithm
Large scale standard data sets
P hub center problem
Algorithm design
Lecture Algorithm design
Algorithm analysis
Dynamic programming
Hirschbergs algorithm
Bellman Ford algorithm
Computer Security
Role Based Access Control
Role Classification Algorithm
Algorithm Preliminaries
Algorithm Training Phase
Algorithm Classification Phase
Computational tractability
Asymptotic order of growth
Polynomial running time
Greedy Algorithms
Dijkstras algorithm
Minimum spanning trees
Network flow
Ford Fulkerson algorithm
Max flow min cut theorem
International Journal of computer science & communication networks
Anomaly detection using genetic
SVM algorithm in data mining
Algorithm in data mining
K mean algorithm
Two algorithm genetic and SVM
Optimization of machining processes using pattern search algorithm
Pattern search algorithm
The PS algorithm
Machining optimization problems
Lecture Data Structure and Algorithm
Bài giảng Cấu trúc dữ liệu và thuật toán
Data Structure and Algorithm
Sorting algorithm
External sort
Internal sort
NTRU encryption algorithm
Digital signature scheme
Lectures on the NTRU encryption algorithm
The NTRU encryption algorithm
Some basic NTRU security issues
Local search
Gradient descent
Metropolis algorithm
Vietnam Journal of Earth Sciences
Algorithm and program for earthquake prediction
Algorithm and program based on the geological
Algorithm and program based on the geophysical
Algorithm and program based on the geomorphological
The maximum magnitude values Mmax
International Journal of Computer Networks and Communications Security
New encryption algorithm
Network RFWKIDEA8 1
Transformation of AES encryption algorithm
New block encryption algorithm
Fault aware and congestion aware routing algorithm
On Odd Even algorithm
Network on chip
The Fault Aware Dynamic Routing algorithm
Advanced Algorithms Analysis and Design
Lecture Advanced Algorithms Analysis and Design
Bài giảng Phân tích và thiết kế thuật toán nâng cao
The Floyd Warshall algorithm
Johnson’s algorithm
A Hardware implementation
Winograd Fourier Transform
Discrete fourier transform
Winograd fourier transform algorithm
Winograd’s small convolution algorithm
Transform algorithm for Cryptography
Graph search
Graph connectivity
Graph traversal
Coin changing
Optimal caching
Counting inversions
Closest pair of points
Randomized quicksort
Master theorem
Integer multiplication
Matrix multiplication
Weighted interval scheduling
Knapsack problem
Bipartite matching
Disjoint paths
Assignment problem
Input queued switching
Poly time reductions
Constraint satisfaction problems
Graph coloring
Decision problems
NP complete
Nondeterministic polynomial
TÀI LIỆU MỚI ĐĂNG
Giáo án mầm non chương trình đổi mới: Đề tài: Ôn xác định vị trí trên – dưới, trước- sau của đối tượng khác.
8
348
3
19-04-2024
Báo cáo khoa học: Loss of kinase activity in Mycobacterium tuberculosis multidomain protein Rv1364c
14
233
0
19-04-2024
Trading Strategies Profit Making Techniques For Stock_3
23
181
0
19-04-2024
Anh văn bằng C-124
8
170
0
19-04-2024
Magnetic Bearings Theory and Applications phần 2
14
170
0
19-04-2024
MySQL Database Usage & Administration PHẦN 7
37
154
0
19-04-2024
Đóng mới oto 8 chỗ ngồi part 9
10
115
0
19-04-2024
XỬ TRÍ CHẤN THƯƠNG SỌ NÃO KÍN
1
111
1
19-04-2024
New Trends and Developments in Automotive Industry Part 7
35
91
0
19-04-2024
báo cáo hóa học:" Rare ligamentum flavum cyst causing incapacitating lumbar spinal stenosis: Experience with 3 Chinese patients"
4
96
0
19-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7859
2219
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5589
1325
Ebook Chào con ba mẹ đã sẵn sàng
112
3749
1228
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8241
1124
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5246
1124
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3471
641
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10861
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3668
524
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4022
513
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4093
478
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.