TAILIEUCHUNG - Programming HandBook part 140

Tham khảo tài liệu 'programming handbook part 140', công nghệ thông tin, kỹ thuật lập trình phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả | Cơ sở dữ liệu Phần quan trọng nhất đối với một ứng dụng từ điển chính là cơ sở dữ liệu CSDL . Việc xây dựng CSDL cho từ điển phải đảm bảo được khả năng truy cập nhanh bởi dữ liệu của từ điển thường khá lớn lên tới hàng chục nghìn từ. Thật may đã xây dựng một format định dạng từ điển rất dễ sử dụng format này đã được dùng để xây dựng những bộ từ điển khá lớn. Dict format được mô tả như sau toàn bộ CSDL được chứa trong 2 file một file chứa nghĩa của từ và một file index. File index bao gồm tên từ vị trí nghĩa của từ bắt đầu trong file chứa nghĩa và độ dài của nghĩa. Vị trí bắt đầu và độ dài của nghĩa được mã hoá theo cách như sau Sử dụng 64 chữ cái ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwx yz0123456789 chữ cái A tương đương số 0 chữ cái B tương đương số 1 . Giữa từ vị trí bắt đầu và độ dài nghĩa phân cách nhau bởi ký tự tab ASCII 9 . Mỗi dòng trong file index chứa dữ liệu của một từ. Các dòng phân cách nhau bởi ký tự xuống dòng ASCII 10 . Ví dụ trong file index của từ điển Đức-Việt có một dòng như sau Abdeckung kbpP D3 Như vậy nghĩa của từ Abdeckung trong file chứa nghĩa sẽ bắt đầu tại offset kbpP theo mã 64 ký tự và có độ dài là D3. Việc chuyển từ mã cơ số 64 về cơ số 10 được thực hiện như sau Đối với vị trí bắt đầu kbpP. Ta có k ở cơ số 64 36 ở cơ số 10 b 27 p 41 P 15. Như vậy chuyển sang cơ số 10 mã kbpP có giá trị là 36 643 27 642 41 641 15 64o 9550415 Đối với độ dài nghĩa D3. Ta có D 3 3 55. Như vậy chuyển sang cơ số 10 mã D3 ở cơ số 64 có giá trị là 247. File index được sắp xếp để giảm bớt thời gian tìm kiếm. Việc mã hoá theo cơ số 64 như trên giúp cho kích thước file index giảm xuống rất nhiều so với không mã hóa. Còn cấu trúc của file chứa nghĩa gồm các phần như sau @headword tu loai noun verb. - dinh nghia 1 cau vi du cho dinh nghia 1 nghia cua cau do - dinh nghia 2 cau vi du cho dinh nghia 2 nghia cua cau do tu loai - dinh nghia 3 Nghĩa của mỗi từ gồm một phần như trên các nghĩa của mỗi từ nối tiếp nhau liên tục. Như vậy .

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.