Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "A New Statistical Approach to Chinese Pinyin Input"
TAILIEUCHUNG - Báo cáo khoa học: "A New Statistical Approach to Chinese Pinyin Input"
Chinese input is one of the key challenges for Chinese PC users. This paper proposes a statistical approach to Pinyin-based Chinese input. This approach uses a trigram-based language model and a statistically based segmentation. Also, to deal with real input, it also includes a typing model which enables spelling correction in sentence-based Pinyin input, and a spelling model for English which enables modeless Pinyin input. | A New Statistical Approach to Chinese Pinyin Input Zheng Chen Microsoft Research China No. 49 Zhichun Road Haidian District 100080 China zhengc@ Abstract Chinese input is one of the key challenges for Chinese PC users. This paper proposes a statistical approach to Pinyin-based Chinese input. This approach uses a trigram-based language model and a statistically based segmentation. Also to deal with real input it also includes a typing model which enables spelling correction in sentence-based Pinyin input and a spelling model for English which enables modeless Pinyin input. 1. Introduction Chinese input method is one of the most difficult problems for Chinese PC users. There are two main categories of Chinese input method. One is shape-based input method such as wu bi zi xing the other is Pinyin or pronunciation-based input method such as Chinese CStar MSPY etc. Because of its facility to learn and to use Pinyin is the most popular Chinese input method. Over 97 of the users in China use Pinyin for input Chen Yuan 1997 . Although Pinyin input method has so many advantages it also suffers from several problems including Pinyin-to-characters conversion errors user typing errors and UI problem such as the need of two separate mode while typing Chinese and English etc. Pinyin-based method automatically converts Pinyin to Chinese characters. But there are only about 406 syllables they correspond to over 6000 common Chinese characters. So it is very difficult for system to select the correct corresponding Chinese characters automatically. A higher accuracy Kai-Fu Lee Microsoft Research China No. 49 Zhichun Road Haidian District 100080 China kfl@ may be achieved using a sentence-based input. Sentence-based input method chooses character by using a language model base on context. So its accuracy is higher than wordbased input method. In this paper all the technology is based on sentence-based input method but it can easily adapted to word-input .
Ngọc Uyển
55
7
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "A New Statistical Approach to Chinese Pinyin Input"
7
46
0
Báo cáo khoa học: "A New Statistical Parser Based on Bigram Lexical Dependencies"
8
46
0
Thermo-physico-chemical and statistical mechanical properties of Washingtonian filifera new lignocellulosic fiber
14
62
0
What can psychology's statistics reformers learn from the error-statistical perspective?
6
53
3
NoLogo: A new statistical model highlights the diversity and suggests new classes of Crm1-dependent nuclear export signals
15
40
1
New statistical randomness tests: 4-bit template matching tests
16
69
0
Statistics for Social and Behavioral Sciences
1
51
0
Comparative Efficiency of Informal (Subjective, Impressionistic) and Formal (Mechanical, Algorithmic) Prediction Procedures: The Clinical–Statistical Controversy
1
76
0
Derivation of some new distributions in statistical mechanics using maximum entropy approach
11
85
1
An improved artificial dendrite cell algorithm for abnormal signal detection
23
68
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462079
59
Giới thiệu :Lập trình mã nguồn mở
14
23855
75
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11129
537
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10374
458
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9656
106
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8662
1151
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8363
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7947
2250
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6985
260
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
6786
1612
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
A New Statistical
Chinese Pinyin Input
Zheng Chen
báo cáo khoa học
mô hình ngôn ngữ
xử lý ngôn ngữ tự nhiên
A New Statistical Parser
Bigram Lexical Dependencies
Collins
Thermo physico chemical
Statistical mechanical properties
Filifera lignocellulosic fiber
Novel cellulosic fibers
Micro graphical SEM
Methods in psychology
The error statistical perspective
The new statistics
Bayesian statistics
Philosophy of statistics
BMC Bioinformatics
Nuclear export signals
Variable length motif model
Alternating hydrophobic
Nonhydrophobic amino acid
Overlapping template matching test
Statistical randomness testing
NIST test suite
4 bit template matching tests
True random number generators
Toward Best Practices
Vertical Linking
Empirical Example
Equating Functions
Statistical Models
New Approaches
quality between
section examines
important small
development
products and new
overarching question
Bose Einstein distribution
Fermi Dirac distribution
Lagrange’s multiplier
Shannons’ measure
Jaynes principle
An improved artificial dendrite cell algorithm
Abnormal signal detection
The statistical cumulative sum
Detect new data points
Considering the acceptance
Data simulation
Data structure
Non parametric
Genomic relationship matrix
Minor allele frequency
Randomness testing
Block cipher
Hash function
Cryptographic primitives
Randomness according
BMC Musculoskeletal Disorders
Implant associated infections
Staphylococcus aureus
Animal models serve
Statistical analysis possible
BMC Geriatrics
Fragility fractures
Timed up and go
Walking speed
Prospectively analyze
Statistical analysis
Dominant marker
Codominant marker
Gamete frequency
EM algorithm
ELS algorithm
TÀI LIỆU MỚI ĐĂNG
TƯƠNG QUAN GIỮA MÔ HỌC, GIẢI PHẪU VÀ HÌNH ẢNH CỦA CÁC KHỐI U PHẦN PHỤ
3
195
1
01-07-2024
Báo cáo nghiên cứu khoa học " KẾT QUẢ NGHIÊN CỨU BƯỚC ĐẦU VỀ THIÊN ĐỊCH CHÂN KHỚP TRÊN CÂY THANH TRÀ Ở THỪA THIÊN HUẾ "
7
215
2
01-07-2024
báo cáo hóa học:" Increased androgen receptor expression in serous carcinoma of the ovary is associated with an improved survival"
6
126
1
01-07-2024
Thương hiệu sản phẩm làng nghề: Đã ít, lại thiếu tính cạnh tranh
5
141
0
01-07-2024
Chương 10: Các phương pháp tính quá trình quá độ trong mạch điện tuyến tính
57
203
5
01-07-2024
báo cáo hóa học:" A decade of modelling research yields considerable evidence for the importance of concurrency: a response to Sawers and Stillwaggon"
7
120
0
01-07-2024
BÀI GIẢNG Biến Đổi Năng Lượng Điện Cơ - TS. Hồ Phạm Huy
137
123
0
01-07-2024
MANAGING NANO-BIO-INFO-COGNO INNOVATIONS
380
129
0
01-07-2024
Valve Selection Handbook - Fourth Edition
337
117
0
01-07-2024
ETHICAL CODE HANDBOOK: Demonstrate your commitment to high standards
7
119
0
01-07-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7947
2250
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
6786
1612
Ebook Chào con ba mẹ đã sẵn sàng
112
4025
1302
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5719
1196
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8662
1151
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3654
667
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3849
601
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4420
548
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11129
537
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4306
483
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.