TAILIEUCHUNG - thiết kế hệ thống trả lời tự động, chương 9

Quá trình chuẩn hóa văn bản thường không đơn giản. Lý do là các văn bản thường chứa nhiều từ cùng chữ, số và viết tắt ñòi hỏi hiểu ñể diễn ñạt lại trong văn bản ñầy đủ. Trong một số ngôn ngữ, các từ có thể được phát âm khác nhau từy theo ngữ cảnh. đa số hệ thống tổng hợp giọng nói không tạo ra thể hiện văn phạm cho văn bản, vì quá trình này hiện chưa có công nghệ ñáng tin cậy. Thay vào ñó, nhiều cách lần mò ñược dùng ñể phân biệt các cách. | Chương 9 Kỹ thuật ngoại diện 1. Chuẩn hóa văn bản. Quá trình chuẩn hóa văn bản thường không nơn giản. Lý do là cácc văn bản thường chứa nhiều từ cùng chữ số và viết tắt nòi hỏi hiểu nể diễn nạt lại trong văn bản nầy nủ. Trong một số ngôn ngữ các từ có thể nược phát âm khác nhau từy theo ngữ cảnh. ỗa số hệ thống tổng hợp giọng nói không tạo ra thể hiện văn phạm cho văn bản vì quá trình này hiện chưa có công nghệ náng tin cậy. Thay vào nó nhiều cách lần mò nược dùng nể phân biệt các cách phát âm như tìm các từ kế cận hay dùng thống kê về tần số xuất hiện. Việc chọn cách phát âm số cũng là một vấn nề. Lý do là cũng có nhiều cách phất âm số từy theo văn cảnh. Như 1325 có thể nọc một nghìn ba trăm hai mươi nhăm nếu nó là một số tự nhiên nhưng cũng có thể là một ba hai năm nếu nó là bốn số mật mã ngân khoản. Thường hệ thống tổng hợp giọng nói có thể noán văn cảnh bằng việc quan sát các từ kế cận các số hay dấu câu bên cạnh hoặc dùng trường hợp mặc nịnh khi không thể phân nịnh. Tương tự các cách viết tắt cũng có thể mang nhiều nghĩa từy thuộc quy ước của người viết. 2. Chuyển Văn bản sang âm vị. Các hệ thống tổng hợp giọng nói dùng hai cách cơ bản ñể xác mnh cách phát âm cho một từ một quá trình còn ñược gọi là chuyển iìổ i văn bản-sang- âm vị hay tự vị-sang-âm vị vì âm vị là thuật ngữ dùng bởi các nhà ngôn ngữ học ñể mô tả các âm khác nhau trong ngôn ngữ. Cách thứ nhất và ñơn giản nhất là dựa vào từ mển sử dụng một từ mển lớn chứa tất cả các từ của một ngôn ngữ và chứa cách phát âm ñúng tương ứng cho từng từ lưu trong máy tính. Việc xác mnh cách phát âm ñúng cho một từ chỉ ñơn giản là tra trong từ mển và thay lìoạn văn bản bằng mã phát âm ñã ghi trong từ mển. Cách thứ hai là dựa trên quy tắc sử dụng các quy tắc phát âm ñể tìm ra cách phát âm tương ứng cho mỗi từ phù hợp với quy tắc. Mỗi cách ñều có ưu mểm và nhược mểm. cách dựa trên từ mển nhanh và chính xác nhưng sẽ không hoạt lìộng nếu từ cần phát âm không có trong từ mển và lượng từ vựng cần lưu là lớn. Cách dùng quy

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.