TAILIEUCHUNG - Lập trình Web ASP với tiếng Việt Unicode

LẬP TRÌNH WEB ASP VỚI TIẾNG VIỆT UNICODE Một số khái niệm căn bản về biểu diễn kí tự bên trong máy tính . Khái niệm về điểm mã, đơn vị mã, bảng mã Về mặt bản chất, máy tính chỉ làm việc với các con số, do đó để biểu diễn các kí tự trên máy tính cần phải có một qui ước nhất quán giữa các kí tự cần biểu diễn và các con số tương ứng mà máy tính xử lí. Qui ước này được thể hiện qua các bước sau: Chọn tập các kí tự cần mã. | LẬP TRÌNH WEB ASP VỚI TIẾNG VIỆT UNICODE Lê Đình Duy Khoa CNTT - ĐHKHTN Tp. HCM ldduy@ 1. Một số khái niệm căn bản về biểu diễn kí tự bên trong máy tính . Khái niệm về điểm mã đơn vị mã bảng mã Về mặt bản chất máy tính chỉ làm việc với các con số do đó để biểu diễn các kí tự trên máy tính cần phải có một qui ước nhất quán giữa các kí tự cần biểu diễn và các con số tương ứng mà máy tính xử lí. Qui ước này được thể hiện qua các bước sau - Chọn tập các kí tự cần mã hóa character set . - Gán cho mỗi kí tự cần mã hóa một giá trị nguyên không âm gọi là điểm mã code point . - Chuyển các điểm mã thành dãy các đơn vị mã code units để cho phục vụ cho việc lưu trữ và mã hóa. Một đơn vị mã là một đơn vị của bộ nhớ có thể là 8 16 hay 32 bit. Các điểm mã không nhất thiết phải có cùng số đơn vị mã. Tập hợp những điểm mã của một tập các kí tự được gọi là một trang mã code page hay còn gọi là bảng mã hay bộ mã. Như vậy khi nói về một bảng mã chúng ta quan tâm đến hai điều chính số lượng các kí tự được mã hóa và cách mã hóa chúng thành các đơn vị mã. Lấy ví dụ bảng mã ASCII tập kí tự cần mã hóa có 128 kí tự bao gồm các kí tự tiếng Anh kí tự số kí tự tiền tệ Anh Mỹ và các kí tự điều khiển hệ thống ngoại vi. Các điểm mã có giá trị nằm trong khoảng từ 0-127. Mỗi điểm mã được mã hóa bằng đúng một đơn vị mã 8 bit có nghĩa là đúng một byte. Việc quyết định chọn cách mã hóa như thế nào sẽ quyết định số lượng kí tự được mã hóa. Ví dụ nếu chọn cách mã hóa các điểm mã bằng đúng một đơn vị mã 8-bit thì số lượng điểm mã của một bảng mã tạm gọi là bảng mã 8 bit chỉ có thể tối đa là 256. Do bảng mã ASCII không đủ để biểu diễn các kí tự của các ngôn ngữ khác ví dụ như tiếng Việt nên Microsoft đã nới rộng bảng mã ASCII bằng cách sử dụng 128 điểm mã có giá trị từ 128-255 để mã hóa cho các kí tự ngoài ASCII này. Tuy nhiên do chỉ có 128 điểm mã trong khi số lượng các kí tự của các ngôn ngữ khác nhiều hơn nên Microsoft đã tạo ra nhiều bảng mã khác nhau cho từng loại ngôn ngữ

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.