TAILIEUCHUNG - Tối ưu hóa lưu trữ bằng nén sâu trong DB2 10

Bản chất của dữ liệu Tin hay không là tùy bạn, khi khối dữ liệu tăng lên, bản số (cardinality) của dữ liệu đó có xu hướng giảm đi. (ND: Thuật ngữ cardinality đề cập đến sự duy nhất của dữ liệu được chứa trong một cột (thuộc tính) cụ thể của bảng dữ liệu). Do đó, đúng là không có nhiều thứ thật sự duy nhất trên thế giới này. Nhiều thứ có thể là duy nhất khi được dùng trong một tổ hợp, nhưng bản thân các yếu tố cơ bản không phải là tất cả những thứ. | m Ẩ 1 r 1 A 1 w r V A -Ể i Tôi ưu hóa lưu trữ băng nén sâu trong DB2 10 Bản chất của dữ liệu Tin hay không là tùy bạn khi khối dữ liệu tăng lên bản số cardinality của dữ liệu đó có xu hướng giảm đi. ND Thuật ngữ cardinality đề cập đến sự duy nhất của dữ liệu được chứa trong một cột thuộc tính cụ thể của bảng dữ liệu . Do đó đúng là không có nhiều thứ thật sự duy nhất trên thế giới này. Nhiều thứ có thể là duy nhất khi được dùng trong một tổ hợp nhưng bản thân các yếu tố cơ bản không phải là tất cả những thứ hay thay đổi. Hãy xem xét bảng các nguyên tố tuần hoàn mọi thứ trên thế giới của chúng ta được tạo thành từ các cách kết hợp của một tập khá nhỏ các nguyên tố. Áp dụng khái niệm này cho dữ liệu và bạn thấy điều này cũng hoàn toàn đúng. Ví dụ theo điều tra dân số mới nhất của Hoa Kỳ có khoảng 300 triệu người sống tại Hoa Kỳ. Tuy nhiên chỉ có khoảng họ duy nhất dẫn đến bản số rất thấp với các nhóm họ khổng lồ trong các tập tên cụ thể. Với các tên thậm chí còn tệ hơn có khoảng tên tên duy nhất với nữ giới và tên duy nhất với nam giới . Tên của các thành phố các đường phố và các địa chỉ chưa kể đến các tên các mô tả và các thuộc tính sản phẩm cũng có xu hướng dư thừa rất cao với bản số thấp có nhiều tên trùng lặp . Nén sâu hoạt động ra sao Nén sâu được dựa trên nguyên lý là một lượng lớn dữ liệu có xu hướng có sự dư thừa rất cao. Nén sâu hoạt động bằng cách tìm kiếm các mẫu lặp lại trong dữ liệu và thay thế các mẫu đó bằng các ký hiệu 12-bit được lưu trữ cùng với các mẫu mà chúng đại diện trong một từ điển tĩnh. Sau khi từ điển này được tạo ra nó được lưu trữ trong bảng hoặc trang cùng với dữ liệu nén và được nạp vào bộ nhớ bất cứ khi nào dữ liệu trong bảng được truy cập để hỗ trợ giải nén . Khi nén sâu được kích hoạt DB2 quét toàn bộ bảng để tìm kiếm các giá trị cột lặp lại và các mẫu lặp lại trong nhiều cột trong một hàng hoặc trên một trang. Nó cũng tìm kiếm các mẫu lặp lại là các chuỗi con của một cột cụ thể. Tuy nhiên tìm thấy mẫu lặp .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.