Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "An Alignment Method for Noisy Parallel Corpora based on Image Processing Techniques"
TAILIEUCHUNG - Báo cáo khoa học: "An Alignment Method for Noisy Parallel Corpora based on Image Processing Techniques"
This paper presents a new approach to bitext correspondence problem (BCP) of noisy bilingual corpora based on image processing (IP) techniques. By using one of several ways of estimating the lexical translation probability (LTP) between pairs of source and target words, we can turn a bitext into a discrete gray-level image. We contend that the BCP, when seen in this light, bears a striking resemblance to the line detection problem in IP. Therefore, BCPs, including sentence and word alignment, can benefit from a wealth of effective, well established IP techniques, including convolution-based filters, texture analysis and Hough transform. . | An Alignment Method for Noisy Parallel Corpora based on Image Processing Techniques Jason s. Chang and Mathis H. Chen Department of Computer Science National Tsing Hua University Taiwan jschang@ mathis @ Phone 886-3-5731069 Fax 886-3-5723694 Abstract This paper presents a new approach to bitext correspondence problem BCP of noisy bilingual corpora based on image processing IP techniques. By using one of several ways of estimating the lexical translation probability LTP between pairs of source and target words we can turn a bitext into a discrete gray-level image. We contend that the BCP when seen in this light bears a striking resemblance to the line detection problem in IP. Therefore BCPs including sentence and word alignment can benefit from a wealth of effective well established IP techniques including convolution-based filters texture analysis and Hough transform. This paper describes a new program PlotAlign that produces a word-level bitext map for noisy or non-literal bitext based on these techniques. Keywords alignment bilingual corpus image processing 1. Introduction Aligned corpora have proved very useful in many tasks including statistical machine translation bilingual lexicography Daille Gaussier and Lange 1993 and word sense disambiguation Gale Church and Yarowsky 1992 Chen Ker Sheng and Chang 1997 . Several methods have recently been proposed for sentence alignment of the Hansards an English-French corpus of Canadian parliamentary debates Brown Lai and Mercer 1991 Gale and Church 1991a Simard Foster and Isabelle 1992 Chen 1993 and for other language pahs such as English-German English-Chinese and English-Japanese Church Dagan Gale Fung Helfman and Satish 1993 Kay and Rõscheisen 1993 Wu 1994 . The statistical approach to machine translation SMT can be understood as a word-by-word model consisting of two sub-models a language model for generating a source text segment s and a translation model for mapping s to its .
Khánh Mai
88
8
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
A new feature to improve Moore’s sentence alignment method
13
65
0
Báo cáo khoa học: "Feature-based Method for Document Alignment in Comparable News Corpora"
9
47
0
Báo cáo khoa học: "An Alignment Method for Noisy Parallel Corpora based on Image Processing Techniques"
8
73
0
DectICO: An alignment-free supervised metagenomic classification method based on feature extraction and dynamic selection
12
37
1
SAlign–a structure aware method for global PPI network alignment
18
36
1
Testing robustness of relative complexity measure method constructing robust phylogenetic trees for Galanthus L. Using the relative complexity measure
12
33
1
MDAT- Aligning multiple domain arrangements
7
48
1
Difference in whole spinal alignment between supine and standing positions in patients with adult spinal deformity using a new comparison method with slotscanning three-dimensional X-ray imager and computed tomography through digital reconstructed radiography
11
40
1
Báo cáo sinh học: " Research Article Subinteger Range-Bin Alignment Method for ISAR Imaging of Noncooperative Targets"
16
41
0
A new method of designing forest roads
7
76
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461887
55
Giới thiệu :Lập trình mã nguồn mở
14
22723
61
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10906
530
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10083
447
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9540
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8302
1127
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8248
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7867
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6713
253
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5795
1391
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
An Alignment Method
Noisy Parallel Corpora
Image Processing Techniques
scientific reports
model language
process natural language
Sentence alignment
Parallel corpora
word clustering
Natural language processing
Alignment algorithms
IBM model
Feature based Method
Document Alignment
Comparable News Corpora
BMC Bioinformatics
Alignment free
Sequence feature
Feature selection
Support vector machine
Protein–protein interaction
Global network alignment
Sequence similarity
Structure similarity
Monte–Carlo algorithm
Relative complexity measure
Most phylogeny analysis methods
Molecular sequences
Alignment parameters
Domain arrangement
Multiple alignment
Protein segments
Alignment method
BMC Musculoskeletal Disorders
Adult spinal deformity
Computed tomography
Digital reconstructed radiolography
Slot scanning 3D X ray imager
Supine and standing position
Whole spinal alignment
Báo cáo sinh học hay
cách trình bày báo cáo
báo cáo sinh học
công trình nghiên cứu sinh học
tài liệu về sinh học
Forest road design
Optimizing road alignment
Minimizing road cost
Modern optimization techniques
Genetic algorithm
Multiple sequence alignment
Significant signals
Phylogenetic noise
Unrelated pair signals
Epidermal growth factor receptor
Coupled mutation finder
Genome Biology
Quality control
Structural variant calling
Alignment comparisons
Bazam facilitates
Waxy gene
Amylose content
DNA marker development
Nucleotide Basic Local Alignment Search Tool
Sanger method
TÀI LIỆU MỚI ĐĂNG
Giáo án mầm non chương trình đổi mới: Gia đình vui nhộn
4
313
1
01-05-2024
Báo cáo khoa học: Loss of kinase activity in Mycobacterium tuberculosis multidomain protein Rv1364c
14
238
0
01-05-2024
Bibliography on Medieval Women, Gender, and Medicine 1980-2009
82
211
0
01-05-2024
BeginningMac OS X Tiger Dashboard Widget Development 2006 phần 2
34
215
0
01-05-2024
TƯƠNG QUAN GIỮA MÔ HỌC, GIẢI PHẪU VÀ HÌNH ẢNH CỦA CÁC KHỐI U PHẦN PHỤ
3
169
0
01-05-2024
Bơm máy nén quạt trong công nghiệp part 8
20
199
2
01-05-2024
MySQL Basics for Visual Learners PHẦN 9
15
186
0
01-05-2024
MySQL Database Usage & Administration PHẦN 9
37
143
0
01-05-2024
BÀI GIẢNG VỀ - MẠCH ĐIỆN II - Chương I: Phân tích mạch trong miền thời gian
38
143
0
01-05-2024
MÔN HỌC VẬT LIỆU VÀ CÔNG NGHỆ KIM LOẠI - PHẦN I: KIM LOẠI HỌC
32
180
2
01-05-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7867
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5795
1391
Ebook Chào con ba mẹ đã sẵn sàng
112
3772
1233
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5334
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8302
1127
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3518
644
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10906
530
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3695
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4071
516
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4136
480
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.