TAILIEUCHUNG - Quality of Telephone-Based Spoken Dialogue Systems phần 4

Quá trình này thường bao gồm một phân tích cú pháp (để xác định cơ cấu thành phần của danh sách từ được công nhận), phân tích ngữ nghĩa (để xác định ý nghĩa của các thành phần), và phân tích một ngữ cảnh. Các phân tích cú pháp và semantical được thực hiện với sự giúp đỡ của một ngữ pháp và liên quan đến một phân tích cú pháp, tôi. | 124 two or more stimuli. In either case the judgment will reflect some type of implicit or explicit reference. The question of reference is an important one for the quality assessment and evaluation of synthesized speech. In contrast to references for speech recognition or speech understanding it refers however to the perception of the user. When no explicit references are given to the user he she will make use of his her internal references in the judgment. Explicit references can be either topline references baseline references or scalable references. Such references can be chosen on a segmental . high-quality or coded speech as a topline or concatenations of co-articulatory neutral phones as a baseline prosodic natural prosody as a topline and original durations and flat melody as a baseline voice characteristic target speaker as a topline for a personalized speech output or on an overall quality level see van Bezooijen and van Heuven 1997 . A scalable reference which is often used for the evaluation of transmitted speech in telephony is calibrated signal-correlated noise generated with the help of a modulated noise reference unit MNRU ITU-T Rec. 1996 . Because it is perceptively not similar to the degradations of current speech synthesizers the use of an MNRU often leads to reference conditions outside the range of systems to be assessed Salza et al. 1996 Klaus et al. 1997 . Time-and-frequency warping TFW has been developed as an alternative producing a controlled wow and flutter effect by speeding up and slowing down the speech signal Johnston 1997 . It is however still perceptively different from the one produced by modern corpus-based synthesizers. The experimental design has to be chosen to equilibrate between test conditions speech material and voices . using a Graeco Latin Square or a Balanced Block design Cochran and Cox 1992 . The length of individual test sessions should be limited to a maximum which the test subjects can tolerate without .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.