Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Empirical Methods for Compound Splitting"
TAILIEUCHUNG - Báo cáo khoa học: "Empirical Methods for Compound Splitting"
Compounded words are a challenge for NLP applications such as machine translation (MT). We introduce methods to learn splitting rules from monolingual and parallel corpora. We evaluate them against a gold standard and measure their impact on performance of statistical MT systems. Results show accuracy of and performance gains for MT of BLEU on a German-English noun phrase translation task. | Empirical Methods for Compound Splitting Philipp Koehn Information Sciences Institute Department of Computer Science University of Southern California koehn@ Kevin Knight Information Sciences Institute Department of Computer Science University of Southern California knight@ Abstract Compounded words are a challenge for NLP applications such as machine translation MT . We introduce methods to learn splitting rules from monolingual and parallel corpora. We evaluate them against a gold standard and measure their impact on performance of statistical MT systems. Results show accuracy of and performance gains for MT of BLEU on a German-English noun phrase translation task. Figure 1 Splitting options for the German word Aktionsplan 1 Introduction Compounding of words is common in a number of languages German Dutch Finnish Greek etc. . Since words may be joined freely this vastly increases the vocabulary size leading to sparse data problems. This poses challenges for a number of NLP applications such as machine translation speech recognition text classification information extraction or information retrieval. For machine translation the splitting of an unknown compound into its parts enables the translation of the compound by the translation of its parts. Take the word Aktionsplan in German see Figure 1 which was created by joining the words Ak-tion and Plan. Breaking up this compound would assist the translation into English as action plan. Compound splitting is a well defined computational linguistics task. One way to define the goal of compound splitting is to break up foreign words so that a one-to-one correspondence to English can be established. Note that we are looking for a one-to-one correspondence to English content words Say the preferred translation of Ak-tionsplan is plan for action. The lack of correspondence for the English word or does not detract from the definition of the task We would still like to break up the German compound .
Tân Thành
75
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Data analysis of empirical bayes methods
0
69
0
Assessment of empirical methods for runoff estimation in Chaskaman catchment of Western Maharashtra, India
5
63
1
Báo cáo khoa học: "An Extensive Empirical Study of Collocation Extraction Methods"
6
81
0
Báo cáo khoa học: "Empirical Methods for Compound Splitting"
8
60
0
Computational Methods for Protein Structure Prediction and Modeling Volume 1: Basic Characterization
407
47
0
Research Methods and Statistics in Psychology
245
62
0
Ebook Observer performance methods for diagnostic imaging: Part 2
286
67
0
Groundwater recharge estimation using comparison of methods in Sirumugai area of coimbatore, Tamil Nadu, India
8
63
0
Hedonic methods in housing markets - Pricing environmental amenities and segregation
282
55
3
Steiner tree methods for optimal sub-network identification: An empirical study
19
36
1
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461846
55
Giới thiệu :Lập trình mã nguồn mở
14
22508
57
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10861
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10024
445
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9488
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8241
1124
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8199
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7859
2219
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6642
253
Vật lý hạt cơ bản (1)
29
5754
85
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Empirical Methods
Compound Splitting
Philipp Koehn
scientific reports
model language
process natural language
Approaches for statistical inference
Bayes approach
The empirical bayes approach
Performance of bayes procedures
Empirical bayes methods
Empirical method
Runoff estimation
Statistical performance
Chaskaman catchment
Assessment of empirical methods
An Extensive Empirical Study
Collocation Extraction Methods
Pavel Pecina
báo cáo khoa học
mô hình ngôn ngữ
xử lý ngôn ngữ tự nhiên
medical books
Biomedical Electronics
Medical Equipment
Empirical Force Fields
Computational Methods
Domain Partitioning
operational definitions
experimental method
Observational methods
establishment paradigm
discrete scales
Descriptive statistics
Observer performance methods
Diagnostic imaging
Empirical operating characteristics possible
Computation and meanings
Visual search paradigms
Recharge estimation
Comparison of methods
Empirical formula
Sirumugai area of coimbatore
Groundwater recharge estimation
Hedonic methods in housing markets
Housing markets
Pricing environmental amenities and segregation
Homebuyer’s countryside view
Empirical developments in hedonic modeling
Biological networks
Systems biology
Steiner tree methods
Bioinformatics field
NP complete
Quantitative methods for the social sciences
The social sciences
Empirical social science
Survey research
Constructing a survey
Conducting a survey
Evaluation and evolution
Bank efficiency considering heterogeneity technology
Empirical study from China
Dagum Gini index
Kernel density estimation methods
Nash sutcliffe efficiency
Root mean square error
SCS CN and surface runoff
Runoff estimation methods
A systemic
Action Research
tesearch model
Research methods
underlying theory
project management
Tài liệu nước ngoài
Tài liệu ngoại ngữ
Kiến thức ngoại ngữ
Tài liệu tiếng Anh
Architecture Knowledge
current guidelines
recommend treatment
symptomatic HIV
antiretroviral treatment
TB incidence
antiretroviral drugs
TÀI LIỆU MỚI ĐĂNG
Đánh giá hao mòn và độ tin cậy của chi tiết và kết cấu trên đầu máy diezel part 3
12
301
0
19-04-2024
Mass Transfer in Multiphase Systems and its Applications Part 19
40
254
1
19-04-2024
THE ANTHROPOLOGY OF ONLINE COMMUNITIES BY Samuel M.Wilson and Leighton C. Peterson
19
138
0
19-04-2024
B2B Content Marketing: 2012 Benchmarks, Budgets & Trends
17
137
0
19-04-2024
Data Structures and Algorithms - Chapter 9: Hashing
54
111
0
19-04-2024
New Trends and Developments in Automotive Industry Part 7
35
91
0
19-04-2024
báo cáo hóa học:" Rare ligamentum flavum cyst causing incapacitating lumbar spinal stenosis: Experience with 3 Chinese patients"
4
96
0
19-04-2024
Fecal Incontinence Diagnosis and Treatment - part 8
35
100
0
19-04-2024
MẪU CHỨNG CHỈ QUẢN LÝ VŨ KHÍ, VẬT LIỆU NỔ, CCHT
1
115
0
19-04-2024
Hóa vô cơ: Viết các phản ứng Oxi hóa khử thường gặp
37
133
2
19-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7859
2219
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5591
1326
Ebook Chào con ba mẹ đã sẵn sàng
112
3749
1228
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8241
1124
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5246
1124
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3471
641
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10861
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3668
524
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4023
513
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4098
478
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.