TAILIEUCHUNG - Hệ thống nhúng nhận dạng tiếng nói tiếng Việt sử dụng Mel-Frequency Cepstral Coefficients và Dynamic Time Warping

Bài viết mô hình nhận dạng mẫu từ đơn tiếng Việt được trình bày. Tiếng nói được trích đặc trưng bằng giải thuật MFCC (Mel-Frequency Cepstral Coefficients). Giải thuật thời gian động DTW (Dynamic Time Warping) được sử dụng để so sánh tiếng nói đầu vào với các mẫu thu sẵn, từ đó sẽ chọn ra được kết quả nhận dạng phù hợp nhất với tiếng nói phát ra. Mời các bạn cùng tham khảo! | HộiHội ThảoThảo Quốc Quốc Gia Gia 2015vềvềĐiện 2015 ĐiệnTử Tử Truyền TruyềnThông Thông và và Công CôngNghệ NghệThông ThôngTinTin ECIT 2015 ECIT 2015 Hệ Thống Nhúng Nhận Dạng Tiếng Nói Tiếng Việt Sử Dụng Mel-Frequency Cepstral Coefficients Và Dynamic Time Warping Lê Đức Lộc Trần Văn Hoàng và Hoàng Trang Khoa Điện Điện Tử Trường Đại Học Bách Khoa ĐHQG TP. Hồ Chí Minh Email ducloc0506@ tvhoang@ hoangtrang@ Abstract Trong bài báo này mô hình nhận dạng mẫu từ đơn dạng của hệ thống khi thực nghiệm đối với bộ từ vựng 4 từ là tiếng Việt được trình bày. Tiếng nói được trích đặc trưng bằng giải 9 và đối với bộ từ vựng gồm 10 từ 10 . thuật MFCC Mel-Frequency Cepstral Coefficients . Giải thuật thời gian động DTW Dynamic Time Warping được sử dụng để so Trong bài báo của chúng tôi hệ thống nhận dạng tiếng nói sánh tiếng nói đầu vào với các mẫu thu sẵn từ đó sẽ chọn ra được sử dụng phương pháp nhận dạng DTW được áp dụng với ngôn kết quả nhận dạng phù hợp nhất với tiếng nói phát ra. Hệ thống ngữ tiếng Việt với ưu điểm là tốc độ nhận dạng nhanh đơn nhận dạng được thực hiện và chạy trên board nhúng BeagleBone giản không yêu cầu bộ nhớ lớn với độ chính xác cao cao hơn Black do Texas Instruments sản xuất. Kết quả nhận dạng cao phù so với hệ thống thực hiện bằng ngôn ngữ tiếng anh 9-10 phù hợp với lý thuyết. hợp trong các hệ thống điều khiển yêu cầu tốc độ đáp ứng Keywords Nhận dạng từ đơn tiếng Việt MFCC DTW. nhanh và tài nguyên phần cứng hạn chế. Đặc biệt việc huấn luyện mẫu cho một từ chỉ yêu cầu một lần đọc làm cho tính linh động của hệ thống rất cao. Đồng thời trong bài báo này I. GIỚI THIỆU chúng tôi cũng tiến hành thực nghiệm với một người khác Nhận dạng tiếng nói là một kỹ thuật có nhiều ứng dụng không phải người huấn luyện cho kết quả khả quan chứng tỏ trong cuộc sống trong việc điều khiển bởi ưu điểm lớn nhất sự linh hoạt và tiện dụng của hệ thống khi áp dụng với ngôn của nó là tốc độ cao tương tác cao và trực quan với con ngữ tiếng

Minh Nhân 31 6 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Kỹ thuật truyền dẫn đa điểm phối hợp trong mạng truyền thông ánh sáng nhìn thấy

6 31 1

Giảm nhỏ kích thước cell EBG bằng cấu trúc phức hợp EBG-DGS đa băng, ứng dụng cho truyền thông di động 5G

5 35 1

Phân tích ảnh hưởng của góc truyền, đường phản xạ và sự phân bố nguồn sáng trong truyền thông ánh sáng khả kiến dùng LED

5 33 1

Phân tích hiệu năng của hệ thống truyền thông chuyển tiếp đường lên với thu thập năng lượng và kết hợp lựa chọn tại nút đích

6 36 1

Kênh truyền sóng trong truyền hình số mặt đất và tác động đến chất lượng truyền dẫn

6 33 1

Đánh giá hiệu năng truyền thông D2D sử dụng vùng hạn chế nhiễu dưới ảnh hưởng của pha-đinh Rayleigh

5 28 1

Mô hình nghiên cứu thực nghiệm về truyền dữ liệu thời gian thực sử dụng ánh sáng đèn LED

6 35 1

Giao thức chuyển giao liên kết trong mạng truyền thông ánh sáng nhìn thấy

5 29 1

Mạng thế hệ mới – Tương lai của Internet và truyền thông

6 37 1

Mô hình đánh giá suy hao hai vùng truyền sóng trong hầm mỏ than chữ nhật

5 32 1

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 462340 61

Giới thiệu :Lập trình mã nguồn mở

14 26025 79

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11345 542

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10550 466

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9841 108

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8889 1161

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8504 426

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8100 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7738 1790

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 7263 268

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Chương 10: Các phương pháp tính quá trình quá độ trong mạch điện tuyến tính

57 233 7 27-12-2024

báo cáo hóa học:" Quality of data collection in a large HIV observational clinic database in sub-Saharan Africa: implications for clinical research and audit of care"

7 154 4 27-12-2024

Sử dụng mô hình ARCH và GARCH để phân tích và dự báo về giá cổ phiếu trên thị trường chứng khoán

24 1073 2 27-12-2024

Valve Selection Handbook - Fourth Edition

337 145 2 27-12-2024

ETHICAL CODE HANDBOOK: Demonstrate your commitment to high standards

7 147 1 27-12-2024

Bệnh sán lá gan trên gia súc và cách phòng trị

3 162 1 27-12-2024

Sáng kiến kinh nghiệm môn mỹ thuật

5 173 1 27-12-2024

ĐỀ LUYỆN THI ĐẠI HỌC MÔN: TIẾNG ANH - SỐ 3

4 128 1 27-12-2024

longman english 1

5 129 0 27-12-2024

CÔNG NGHỆ MÔI TRƯỜNG - CHƯƠNG 5 CƠ SỞ QUÁ TRÌNH XỬ LÝ SINH HỌC

1 142 0 27-12-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8100 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7738 1790

Ebook Chào con ba mẹ đã sẵn sàng

112 4406 1371

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 6283 1266

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8889 1161

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3839 680

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3919 609

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4708 565

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11345 542

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4508 490