TAILIEUCHUNG - Báo cáo hóa học: " Reliable likelihood ratios for statistical modelbased voice activity detector with low false-alarm rate"

Tuyển tập báo cáo các nghiên cứu khoa học quốc tế ngành hóa học dành cho các bạn yêu hóa học tham khảo đề tài: Reliable likelihood ratios for statistical modelbased voice activity detector with low false-alarm rate | Kim et al. EURASIP Journal on Advances in Signal Processing 2011 2011 31 http content 2011 1 31 o EURASIP Journal on Advances in Signal Processing a SpringerOpen Journal RESEARCH Open Access Reliable likelihood ratios for statistical modelbased voice activity detector with low false-alarm rate Younggwan Kim Youngjoo Suh and Hoirin Kim Abstract The role of the statistical model-based voice activity detector SMVAD is to detect speech regions from input signals using the statistical models of noise and noisy speech. The decision rule of SMVAD is based on the likelihood ratio test LRT . The LRT-based decision rule may cause detection errors because of statistical properties of noise and speech signals. In this article we first analyze the reasons why the detection errors occur and then propose two modified decision rules using reliable likelihood ratios LRs . We also propose an effective weighting scheme considering spectral characteristics of noise and speech signals. In the experiments proposed in this study with almost no additional computations the proposed methods show significant performance improvement in various noise conditions. Experimental results also show that the proposed weighting scheme provides additional performance improvement over the two proposed SMVADs. Keywords voice activity detector statistical model reliability of likelihood ratio 1. Introduction The purpose of a voice activity detector VAD is to discriminate between speech and non-speech regions from the input signals in various noisy conditions. VAD techniques have widely been used in many speech applicable fields such as speech recognition speaker recognition speech coding and speech enhancement as a preprocessor because they can help us to improve the performance of those recognition systems and enhance the channel efficiency of the speech coding system. In general most of the conventional VAD systems assume that the statistical property of noise is stationary over

TÀI LIỆU LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.