TAILIEUCHUNG - Báo cáo khoa học: "Fast Syntactic Analysis for Statistical Language Modeling via Substructure Sharing and Uptraining"

Long-span features, such as syntax, can improve language models for tasks such as speech recognition and machine translation. However, these language models can be difﬁcult to use in practice because of the time required to generate features for rescoring a large hypothesis set. In this work, we propose substructure sharing, which saves duplicate work in processing hypothesis sets with redundant hypothesis structures. | Fast Syntactic Analysis for Statistical Language Modeling via Substructure Sharing and Uptraining Ariya Rastrow Mark Dredze Sanjeev Khudanpur Human Language Technology Center of Excellence Center for Language and Speech Processing Johns Hopkins University Baltimore MD uSa ariya mdredze khudanpur @ Abstract Long-span features such as syntax can improve language models for tasks such as speech recognition and machine translation. However these language models can be difficult to use in practice because of the time required to generate features for rescoring a large hypothesis set. In this work we propose substructure sharing which saves duplicate work in processing hypothesis sets with redundant hypothesis structures. We apply substructure sharing to a dependency parser and part of speech tagger to obtain significant speedups and further improve the accuracy of these tools through up-training. When using these improved tools in a language model for speech recognition we obtain significant speed improvements with both N-best and hill climbing rescoring and show that up-training leads to WER reduction. 1 Introduction Language models LM are crucial components in tasks that require the generation of coherent natural language text such as automatic speech recognition ASR and machine translation MT . While traditional LMs use word n-grams where the n 1 previous words predict the next word newer models integrate long-span information in making decisions. For example incorporating long-distance dependencies and syntactic structure can help the LM better predict words by complementing the predictive power of n-grams Chelba and Jelinek 2000 Collins et al. 2005 Filimonov and Harper 2009 Kuo et al. 2009 . 175 The long-distance dependencies can be modeled in either a generative or a discriminative framework. Discriminative models which directly distinguish correct from incorrect hypothesis are particularly attractive because they allow the inclusion of arbitrary features .

Thục Ðào 64 9 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Báo cáo khoa học: "Fast Syntactic Analysis for Statistical Language Modeling via Substructure Sharing and Uptraining"

9 47 0

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 462336 61

Giới thiệu :Lập trình mã nguồn mở

14 25946 79

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11336 542

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10544 466

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9836 108

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8885 1161

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8500 426

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8098 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7710 1789

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 7243 268

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp

5 167 2 24-12-2024

BÀI GIẢNG Biến Đổi Năng Lượng Điện Cơ - TS. Hồ Phạm Huy

137 157 1 24-12-2024

Đề tài " Dự báo về tác động của Tổ chức Thương mại Thế giới WTO đối với các doanh nghiệp xuất khẩu vừa và nhỏ Việt Nam – Những giải pháp đề xuất "

72 183 2 24-12-2024

Báo cáo " Thẩm quyền quản lí nhà nước đối với hoạt động quảng cáo thực trạng và hướng hoàn thiện "

7 204 7 24-12-2024

Báo cáo " Bàn về hành vi pháp luật và hành vi đạo đức "

11 177 2 24-12-2024

Báo cáo nghiên cứu khoa học " Vai trò chính quyền địa phương trong phát triển kinh tế : khu chuyên doanh gốm sứ ( Trung Quốc ) và Bát Tràng ( Việt Nam )("

11 212 1 24-12-2024

Báo cáo nghiên cứu khoa học " Sự nhất quán phát triển kinh tế thị trường XHCN trong xây dựng xã hội hài hoà của Trung Quốc và đổi mới của Việt Nam "

8 144 1 24-12-2024

Sáng kiến kinh nghiệm môn mỹ thuật

5 171 1 24-12-2024

TRẮC NGHIỆM - CÁC BỆNH THIẾU DINH DƯỠNG THƯỜNG GẶP

32 208 2 24-12-2024

CÂU HỎI TRẮC NGHIỆM HSLS NƯỚC TIỂU

9 175 0 24-12-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8098 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7710 1789

Ebook Chào con ba mẹ đã sẵn sàng

112 4406 1371

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 6275 1266

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8885 1161

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3836 680

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3918 609

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4703 565

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11336 542

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4502 490