TAILIEUCHUNG - Mã dựng sẵn và mã tổ hợp, bàn thêm về Unicode và TCVN 6909

Dựng sẵn và tổ hợp Có hai dòng giải pháp chính để xử lý tiếng Việt trên máy tính là mã dựng sẵn và mã tổ hợp. Cả hai đều có những ưu và nhược điểm riêng và cũng là chủ đề gây nhiều tranh bài này chúng ta sẽ phân tích một cách có hệ thống khía cạnh kỹ thuật của cả hai giải pháp này, đồng thời cũng bàn thêm một số điểm khác xung quanh Unicode vàTCVN5909. Trước tiên cần làm rõ các khái niệm ký tự dựng sẵn và ký tự tổ hợp. Ký. | Mã dựng sẵn và mã tổ hợp bàn thêm về Unicode và TCVN 6909 Dựng sẵn và tổ hợp Có hai dòng giải pháp chính để xử lý tiếng Việt trên máy tính là mã dựng sẵn và mã tổ hợp. Cả hai đều có những ưu và nhược điểm riêng và cũng là chủ đề gây nhiều tranh bài này chúng ta sẽ phân tích một cách có hệ thống khía cạnh kỹ thuật của cả hai giải pháp này đồng thời cũng bàn thêm một số điểm khác xung quanh Unicode vàTCVN5909. Trước tiên cần làm rõ các khái niệm ký tự dựng sẵn và ký tự tổ hợp. Ký tự dựng sẵn là ký tự duy nhất không được tổ hợp từ những ký tự khác. Ký tự tổ hợp là ký tự được tổ hợp từ những ký tự cơ bản ví dụ chữ ký tự ừ là tổ hợp của ký tự cơ bản và ký tự dấu thanh huyền .Trong Unicode ký tự tổ hợp còn có thể được tổ hợp từ những thành phần nhỏ hơn như ký tự ASCII ký tự dấu nguyên âm và ký tự dấu thanh- khi đó ta có đang biểu diễn chính tắc canonical . Vídụ chữ ừ trong các dạng biễu diễn nói trên sẽ là chuỗi ký tự sau Tổ hợp ký tự Chuỗi mã Hex Dựng sẵn ư 1EAB Tổ hợp ư 01B0 0300 Chính tắc u 0075 031B 0300 Mã dựng sẵn và mã tổ hợp là quá trình mã hóa các ký tự thành các ký tự dựng sẵn hay thành các ký tự tổ hợp. Trong bài này ta sẽ coi Canonical cũng là một dạng của mã hoá tổ hợp. ƯU ĐIỂM CỦA MÃ TỔ HỢP Mã tổ hợp có phần gọn nhẹ và chiếm ít mã hơn trong bảng mã chỉ cần 20 vị trí cho ký tự thuần Việt ă â ê ô ơ ư ă â Ê Ô Ơ ư các dấu thanh huyền hói ngã sắc nặng và dấu tổ hợp nguyên âm nón mũ râu cho dạng canomcal trong khi mã dựng sẵn cần đến 134 cho ký tự thuần Việt. Mã tổ hợp có phần gần với ngôn ngữ tự nhiên Việt hơn trong quá trình ghép chữ ghép vần. Mã tổ hợp sẽ dễ dàng hơn trong việc chuyển đổi chữ hoa chữ thường trong một số ứng dụng có thể dùng luôn tính năng Change case có sẵn để chuyển đổi . Mã tổ hợp có vẻ như dễ dàng hơn trong việc sắp xếp tiếng Việt nhưng thực ra không phải như vậy lý do là các dấu thanh huyền sắc ngã

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.