TAILIEUCHUNG - Cải thiện hiệu năng hệ thống nhận dạng tiếng Việt với thông tin về phương ngữ

Bài viết trình bày kết quả th nghiệm nhận dạng phương ngữ tiếng Việt và việc cải thiện hiệu năng của hệ thống nhận dạng tiếng Việt khi có thông tin về phương ngữ. Mời các bạn cùng tham khảo bài viết để nắm chi tiết hơn nội dung nghiên cứu. | Kỷ yếu Hội nghị Khoa học Quốc gia lần thứ IX Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR 9 Cần Thơ ngày 4-5 8 2016 DOI CẢI THIỆN HIỆU NĂNG HỆ THỐNG NHẬN DẠNG TIẾNG VIỆT VỚI THÔNG TIN VỀ PHƯƠNG NGỮ Phạm Ngọc Hƣng 1 2 Trịnh Văn Loan1 2 Nguyễn Hồng Quang2 Trần Vũ Duy2 1 Khoa Công nghệ thông tin Trường Đại học Sư phạm Kỹ thuật Hưng Yên 2 Viện Công nghệ Thông tin và Truyền thông Trường Đại học Bách khoa Hà Nội phamngochung@ loantv@ quangnh@ tranvuduy14@ TÓM TẮT Tiếng Việt là ngôn ngữ có thanh điệu và có nhiều phương ngữ khác nhau. Ảnh hưởng của yếu tố phương ngữ tới các hệ thống nhận dạng tự động tiếng Việt nói là đáng kể. Có nhiều phương pháp khác nhau đã được nghiên cứu và áp dụng cho nhận dạng phương ngữ như GMM Gaussian Mixture Model Supervector . ài báo tr nh bày kết quả th nghiệm nhận dạng phương ngữ tiếng Việt và việc cải thiện hiệu n ng của hệ thống nhận dạng tiếng Việt khi có thông tin về phương ngữ. Ngữ liệu d ng cho nhận dạng là phương ngữ của ba giọng Hà Nội Huế Thành phố Hồ Chí Minh đại diện cho ba miền ắc Trung Nam. Mô hình GMM đã được d ng để nhận dạng phương ngữ. Kết quả th nghiệm cho th y tỷ lệ nhận dạng đ ng phương ngữ tiếng Việt đạt 71 khi s dụng các tham số MFCC kết hợp với F0 chuẩn hóa theo trung b nh của F0 t ng 12 so với trường hợp chỉ s dụng MFCC. Tỷ lệ nhận dạng tiếng Việt nói s dụng HMM được n ng cao khi b sung thông tin về phương ngữ với lỗi từ là 6 76 giảm 2 61 so với trường hợp chưa có thông tin phương ngữ. Từ khóa Nhận dạng phương ngữ tiếng Việt GMM HMM MFCC tần số cơ bản nhận dạng tiếng Việt nói. I. GIỚI THIỆU Hệ thống nhận dạng tự động tiếng nói đã được nghiên cứu từ sớm và đạt được nhiều tiến bộ. Chất lượng nhận dạng đã được nâng cao tuy nhiên hiệu năng nhận dạng tỷ lệ nhận dạng chưa đúng vẫn còn đáng kể. Có nhiều yếu tố tác động và là nguyên nhân ảnh hưởng đến hiệu năng của hệ thống nhận dạng tự động tiếng nói. Trong số đó có thể kể đến yếu tố về .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.