TAILIEUCHUNG - Nén âm thanh thoại dựa vào ngưỡng nghe tuyệt đối và phân bố dải tới hạn của tai người

Bài báo này đề xuất một giải pháp để nén âm thanh thoại mà chất lượng vẫn không đổi. Cơ sở của giải pháp này dựa vào ngưỡng nghe tuyệt đối và phân bố dải tới hạn của tai người. Dải phổ âm thanh thoại 4kHz được phân chia thành 3 dải con, mỗi dải con bao phủ một số dải tới hạn của tai người. Trong mỗi dải con loại bỏ những thành phần tai người không nghe thấy. Những dải con có năng lượng phổ nhỏ, được mã hóa với số lượng bít ít và ngược lại. | Nguyễn Xuân Trường Tạp chí KHOA HỌC & CÔNG NGHỆ 135(05): 39 - 44 NÉN ÂM THANH THOẠI DỰA VÀO NGƯỠNG NGHE TUYỆT ĐỐI VÀ PHÂN BỐ DẢI TỚI HẠN CỦA TAI NGƯỜI Nguyễn Xuân Trường* Trường Cao đẳng Phát thanh-Truyền hình I TÓM TẮT Để tiết kiệm tần phổ, trong thông tin thoại âm thanh chỉ lấy tới 4kHz. Trong phổ tần đó, tai người chỉ nghe được những tone có năng lượng đủ lớn, lớn hơn ngưỡng nghe tối thiểu. Hơn nữa, những tone âm thanh yếu xuất hiện gần (cả miền tần số và miền thời gian) những tone âm thanh mạnh đều có thể bị che khuất, tai người cũng không thể nghe được. Bài báo này đề xuất một giải pháp để nén âm thanh thoại mà chất lượng vẫn không đổi. Cơ sở của giải pháp này dựa vào ngưỡng nghe tuyệt đối và phân bố dải tới hạn của tai người. Dải phổ âm thanh thoại 4kHz được phân chia thành 3 dải con, mỗi dải con bao phủ một số dải tới hạn của tai người. Trong mỗi dải con loại bỏ những thành phần tai người không nghe thấy. Những dải con có năng lượng phổ nhỏ, được mã hóa với số lượng bít ít và ngược lại. Từ khóa: Mã hóa băng con (SBC), Mức áp suất âm thanh (SPL), Hài âm thanh có khả năng che (Tone Masker), Hài âm thanh bị hài khác che (Tone Maskee) GIỚI THIỆU CHUNG* Âm thanh thoại ở định dạng không nén, tần số lấy mẫu 8kHz, do đó tần số cực đại của âm thanh thoại chỉ là 4kHz. Với mã hóa 8 bít/mẫu thì tốc độ bít là 8kHz x 8bits/mẫu = 64kbps. Thực tế có nhiều thuật toán mã hóa nén âm thanh với tỷ lệ nén khác nhau. Mã hóa dải con là một trong những thuật toán đạt tỷ lệ nén dữ liệu cao. Điển hình là thuật toán ứng dụng trong chuẩn âm thanh MPEG cho tỷ lệ nén dữ liệu lên tới 12:1 (128kbps lớp III) so với CD (Linear PCM, tốc độ bít là 1411kbps). Chuẩn MPEG phân chia dải tần tín hiệu âm thanh lên đến 32 dải con. Thuật toán ATRAC1 giảm tốc độ bít xuống còn 292kbps (3 dải con), thuật toán ATRAC3 tốc độ bít còn 132kbps (4 dải con), thuật toán ATRAC3plus tốc độ bít là 64kbps (16 dải con). Tất cả các thuật toán đều dùng phân chia Wavelet (các hệ số phân chia đều là lũy thừa của 2), .

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.