TAILIEUCHUNG - Nhận dạng giọng chữ cái tiếng Việt sử dụng deep Boltzmann machines

Nhận diện giọng nói là một bài toán thu hút được quan tâm rộng rãi của nhiều nhà nghiên cứu trong lĩnh vực trí tuệ nhân tạo trong những năm gần đây. Chẳng hạn như bài toán xây dựng chương trình để robot có khả năng nhận biết giọng nói của con người, hay các thiết bị có thể hiểu và đối thoại trực tiếp với người cùng nói chuyện. Trong nghiên cứu này, 37 sinh viên của Học viện Nông nghiệp Việt Nam tham gia để thu thập dữ liệu phát âm liên tục 29 chữ cái trong bảng chữ cái tiếng Việt. Qua bước tiền xử lý dữ liệu để trích xuất ra các mẫu âm thanh thuộc tính cho phân lớp, phương pháp nhận dạng chúng tôi sử dụng để nhận diện các mẫu giọng nói là deep Boltzmann machine (DBM), một mạng có khả năng học sâu với kiến trúc nhiều tầng ẩn. Để đánh giá khả năng nhận dạng của phương pháp đề xuất, chúng tôi so sánh DBM với mạng nơron truyền thống (NN) có cùng kiến trúc số tầng ẩn. | Vietnam J. Agri. Sci. 2021 Vol. 19 No. 4 435-442 Tạp chí Khoa học Nông nghiệp Việt Nam 2021 19 4 435-442 NHẬN DẠNG GIỌNG CHỮ CÁI TIẾNG VIỆT SỬ DỤNG DEEP BOLTZMANN MACHINES Hoàng Thị Thanh Giang Nguyễn Thị Thúy Hạnh Nguyễn Trọng Kương Khoa Công nghệ thông tin Học viện Nông nghiệp Việt Nam Tác giả liên hệ ntthuyhanh@ Ngày nhận bài Ngày chấp nhận đăng TÓM TẮT Nhận diện giọng nói là một bài toán thu hút được quan tâm rộng rãi của nhiều nhà nghiên cứu trong lĩnh vực trí tuệ nhân tạo trong những năm gần đây. Chẳng hạn như bài toán xây dựng chương trình để robot có khả năng nhận biết giọng nói của con người hay các thiết bị có thể hiểu và đối thoại trực tiếp với người cùng nói chuyện. Trong nghiên cứu này 37 sinh viên của Học viện Nông nghiệp Việt Nam tham gia để thu thập dữ liệu phát âm liên tục 29 chữ cái trong bảng chữ cái tiếng Việt. Qua bước tiền xử lý dữ liệu để trích xuất ra các mẫu âm thanh thuộc tính cho phân lớp phương pháp nhận dạng chúng tôi sử dụng để nhận diện các mẫu giọng nói là deep Boltzmann machine DBM một mạng có khả năng học sâu với kiến trúc nhiều tầng ẩn. Để đánh giá khả năng nhận dạng của phương pháp đề xuất chúng tôi so sánh DBM với mạng nơron truyền thống NN có cùng kiến trúc số tầng ẩn. Kết quả cho thấy khả năng nhận dạng các mẫu âm thanh chữ cái tốt hơn của DBM với khả năng học cho độ chính xác trung bình là 68 trên dữ liệu đào tạo và 51 khi thử với dữ liệu test trong khi kết quả này của NN là 61 và 48 tương ứng. Từ khóa Trí tuệ nhân tạo học máy mạng nơron máy Boltzmann học sâu. Speech Recognition of Vietnamese Alphabet using Deep Boltzmann Machines ABSTRACT Speech recognition has been attracting many researchers in the field of artificial intelligence recently. For example the problem of implementing a program for robots to recognize human speech thereby robots can understand learn and talk with human. In this study 37 students from Vietnam National University of Agriculture were involved to .

Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.