TAILIEUCHUNG - Quality of Telephone-Based Spoken Dialogue Systems phần 6

tiếng nói và một nhóm trong giọng nói tổng hợp và tự nhiên. Bản án chất lượng tổng thể chủ yếu là so sánh với các ước tính được đưa ra bởi các mô hình E-. Tuy nhiên, trái ngược với mô hình, một sự suy thoái MOS đáng chú ý đã có thể được quan sát thấy mức độ tiếng ồn rất thấp (Nc giữa -100 và -60 dBm0p). | Quality of Synthesized Speech over the Phone 221 Figure . Effect of narrow-band circuit noise Nc. Normalized MOSn and E-model prediction for individual voices. N for -100 dBmp. Figure . Effect of narrow-band circuit noise Nc. Normalized MOSn PESQ and TOSQA model predictions for synthetic vs. natural voices. N for -100 dBmp. the voice p and a grouping in synthetic and natural voices. The overall quality judgments are mainly comparable to the estimations given by the E-model. However in contrast to the model a remarkable MOS degradation can already be observed for very low noise levels Nc between -100 and -60 dBm0p . This degradation is statistically significant only for natural voice 1 for all other voices the overall quality starts to degrade significantly at narrow-band noise levels higher than -60 dBm0p. The listening-effort MOSle and the intelligibility INT ratings are similar to those obtained for wide-band circuit noise conditions. 222 Figure . Effect of signal-correlated noise with signal-to-quantizing-noise ratio Q. Normalized MOSn and E-model prediction for individual voices. When comparing the results for narrow-band circuit noise Nc with the predictions from signal-based comparative measures the graph is similar to the one found for wideband noise Nfor see Figure . The predictions for naturally produced and synthesized speech from PESQ are close to each other whereas the TOSQA model predicts a higher quality decrease for the naturally produced speech an estimation which is supported by the auditory tests. As for N for the TOSQA model predicts a very steep decrease for the MOS values with increasing noise levels whereas the shape of the curve predicted by PESQ is closer to the one found in the auditory test. As can be expected the scatter of the auditory test results for medium noise levels Nc 70. - 60 dBmOp is not reflected in the signal-based model predictions. It will have its origin in the subjective ratings and not in the speech .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.