TAILIEUCHUNG - Nhận dạng tiếng nói bền vững sử dụng kỹ thuật thừa số hóa ma trận không âm kết hợp với kỹ thuật về độ không đảm bảo của các đặc trưng âm học

Trong hệ thống nhận dạng tiếng nói kỹ thuật thừa số hóa ma trận không âm có thể được sử dụng trong khâu tiền xử lý để loại bỏ nhiễu, nâng cao chất lượng tiếng nói cần nhận dạng và do đó có thể tăng chất lượng của hệ thống nhận dạng tiếng nói trong môi trường nhiễu. Tuy nhiên, tín hiệu sau khi nâng cao thường vẫn còn chứa một phần nhiễu. | Nhận dạng tiếng nói bền vững sử dụng kỹ thuật thừa số hóa ma trận không âm kết hợp với kỹ thuật về độ không đảm bảo của các đặc trưng âm học Kỹ thuật điều khiển & Điện tử NHẬN DẠNG TIẾNG NÓI BỀN VỮNG SỬ DỤNG KỸ THUẬT THỪA SỐ HÓA MA TRẬN KHÔNG ÂM KẾT HỢP VỚI KỸ THUẬT VỀ ĐỘ KHÔNG ĐẢM BẢO CỦA CÁC ĐẶC TRƯNG ÂM HỌC Nguyễn Hữu Bình1, Phạm Thị Ngọc Yến1,2, Nguyễn Quốc Cường1,2* Tóm tắt: Trong hệ thống nhận dạng tiếng nói kỹ thuật thừa số hóa ma trận không âm có thể được sử dụng trong khâu tiền xử lý để loại bỏ nhiễu, nâng cao chất lượng tiếng nói cần nhận dạng và do đó có thể tăng chất lượng của hệ thống nhận dạng tiếng nói trong môi trường nhiễu. Tuy nhiên, tín hiệu sau khi nâng cao thường vẫn còn chứa một phần nhiễu. Thông tin sai khác giữa tín hiệu nâng cao và tín hiệu sạch, hay gọi là độ không đảm bảo, có thể là thông tin hữu ích cho quá trình giải mã của hệ thống nhận dạng tiếng nói. Trong bài báo này, chúng tôi trình bày một phương pháp nâng cao chất lượng hệ thống nhận dạng tiếng nói dựa trên kỹ thuật thừa số hóa ma trận không âm kết hợp với kỹ thuật giải mã sử dụng thông tin về độ không đảm bảo của vec-tơ đặc trưng. Chúng tôi đã đánh giá phương pháp kết hợp này trong hệ thống nhận dạng tiếng nói tiếng Việt. Các kết quả cho thấy phương pháp kết hợp đã nâng cao độ chính xác của hệ thống nhận dạng hơn so với việc chỉ sử dụng kỹ thuật thừa số hóa ma trận không âm trong hệ thống nhận dạng tiếng nói. Từ khóa: Nhận dạng tiếng nói, Thừa số hóa ma trận không âm, Ước lượng độ không đảm bảo. 1. ĐẶT VẤN ĐỀ Nhận dạng tiếng nói tự động (ASR: Automatic Speech Recognition) là lĩnh vực thu hút sự quan tâm của nhiều nhà nghiên cứu trong các ứng dụng về tương tác người máy và dịch tiếng nói tự động. Kết quả nhận dạng trong môi trường không nhiễu đạt tỷ lệ khá cao, hơn 90%. Tuy nhiên, trong môi trường ứng dụng thực tế có nhiễu thì chất lượng nhận dạng giảm đáng kể do có sự sai khác giữa cơ sở dữ liệu dùng để huấn luyện

Phụng Việt 149 9 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Bài giảng Xử lý tiếng nói: Phần 2

63 24 1

Quy trình xây dựng dữ liệu và huấn luyện liên tục hệ thống nhận dạng tiếng nói ở phía khách hàng

3 37 1

Nhận dạng giọng nói tiếng Việt bằng logic mờ

7 22 1

Luận văn:Nhận dạng tiếng nói tiếng việt - tìm hiểu và ứng dụng

1 111 3

Phương pháp điều khiển thiết bị bằng tiếng nói

6 172 1

Luận văn thạc sĩ: Nghiên cứu kỹ thuật nhận dạng tiếng nói tiếng Việt và ứng dụng

81 103 1

Tiểu luận: Tóm lược lịch sử phát triển nhận dạng tiếng nói

27 90 0

Sử dụng mảng micro để tăng cường chất lượng nhận dạng tiếng nói

3 1 1

Tiếng việt lý thuyết

155 91 0

Kết hợp phương pháp lượng tử hóa vector và mô hình Markov ẩn trong nhận dạng tiếng nói Tiếng Việt - Ứng dụng trong điều khiển ti vi

6 103 1

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 461864 55

Giới thiệu :Lập trình mã nguồn mở

14 22635 59

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10884 529

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10064 446

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9519 104

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8280 1125

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8230 423

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7864 2220

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 6686 253

Vật lý hạt cơ bản (1)

29 5770 85

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Giáo án mầm non chương trình đổi mới: Gia đình vui nhộn

4 312 1 26-04-2024

Động cơ đốt trong và máy kéo công nghiêp tập 1 part 7

23 258 0 26-04-2024

Động cơ đốt trong và máy kéo công nghiêp tập 2 part 8

32 260 0 26-04-2024

Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# Tập 2 - Chương 4

47 246 1 26-04-2024

beginning Ubuntu Linux phần 1

34 212 1 26-04-2024

Bơm máy nén quạt trong công nghệ part 1

20 249 2 26-04-2024

extremetech Hacking Firefox phần 7

46 187 0 26-04-2024

Anh văn bằng C-124

8 175 0 26-04-2024

Báo cáo nghiên cứu khoa học " KẾT QUẢ NGHIÊN CỨU BƯỚC ĐẦU VỀ THIÊN ĐỊCH CHÂN KHỚP TRÊN CÂY THANH TRÀ Ở THỪA THIÊN HUẾ "

7 175 0 26-04-2024

Bơm máy nén quạt trong công nghiệp part 8

20 198 2 26-04-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7864 2220

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 5722 1368

Ebook Chào con ba mẹ đã sẵn sàng

112 3767 1231

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 5319 1136

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8280 1125

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3498 643

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10884 529

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3684 525

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4046 515

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4127 480