TAILIEUCHUNG - Một phương pháp tăng cường dữ liệu cho bài toán nhận dạng ngữ điệu tiếng nói

Bài viết Một phương pháp tăng cường dữ liệu cho bài toán nhận dạng ngữ điệu tiếng nói đề xuất phương pháp thay đổi tốc độ để gia tăng dữ liệu học giúp tăng chất lượng nhận dạng cảm xúc. Kết quả thử nghiệm trên tập dữ liệu IEMOCAP cho 4 lớp ngữ điệu khác nhau: Angry, happy, neutral, sad cho kết quả khả quan. | Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN 978-604-82-2981-8 MỘT PHƯƠNG PHÁP TĂNG CƯỜNG DỮ LIỆU CHO BÀI TOÁN NHẬN DẠNG NGỮ ĐIỆU TIẾNG NÓI Lê Đăng Linh1 2 Đỗ Văn Hải3 1 Khoa Điện Trường Đại học Bách Khoa Hà Nội 2 Trung tâm Không gian Mạng Viettel 3 Trường Đại học Thủy lợi email haidv@ 1. GIỚI THIỆU CHUNG 2. PHƯƠNG PHÁP NGHIÊN CỨU Hiện nay có rất nhiều ứng dụng thực tế . Xây dựng hệ thống cần thông tin về cảm xúc của tiếng nói. Ví Hệ thống nhận dạng cảm xúc bằng tiếng dụ trong các hệ thống tổng đài chăm sóc nói được xây dựng dựa trên mô hình phân lớp dữ liệu. Hệ thống này bao gồm 3 phần khách hàng việc đánh giá mức độ hài lòng chính xử lý dữ liệu trích chọn đặc trưng cũng như thái độ người dùng giúp cho huấn luyện bộ nhận dạng. việc nâng cao chất lượng dịch vụ là vô cùng cần thiết. Trong những năm gần đây phương pháp học sâu đã đem lại những tiến bộ vượt bậc Hình 1. Cấu trúc hệ thống nhận dạng. trong xử lý tiếng nói 1 2 . Đặc biệt với bài toán nhận dạng cảm xúc trong lời nói 3 . Trong bài toán này trích chọn những đặc Những nghiên cứu gần đây 4 đã chỉ ra việc trưng cảm xúc là vấn đề chính ảnh hưởng tới sử dụng mạng nơ-ron tích chập CNN làm chất lượng hệ thống. Rất nhiều các nghiên bộ phân lớp cho bài toán nhận dạng ngữ cứu đề xuất sử dụng những đặc trưng tiếng nói 6 bao gồm thông tin cảm xúc như điệu tiếng nói cho kết quả tốt hơn nhiều so energy pitch formant frequency Mel- với các phương pháp truyền thống khác như Frequency Cepstrum coefficients MFCC . mô hình GMM mô hình mạng nơ-ron sâu Những đặc trưng sau khi được lựa chọn sẽ DNN . Tuy nhiên dữ liệu cho việc đào tạo được đưa qua những thuật toán phân mô hình đang là một khó khăn lớn đặt ra bởi bài báo này chúng tôi sử dụng dữ liệu tiếng nói nói chung đặc biệt là dữ mạng CNN giúp đem lại chất lượng nhận liệu về cảm xúc nói riêng có rất ít và khó dạng tốt nhất. Bên cạnh việc lựa chọn đặc tìm. Do vậy các phương pháp gia tăng dữ trưng và mô hình bộ phân lớp thì dữ liệu là liệu học .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.