Đang chuẩn bị liên kết để tải về tài liệu:
Bài giảng Khai phá dữ liệu (Data mining): Chương 2 - Lê Tiến

Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ

Chương 2 đề cập đến các vấn đề tiền xử lý dữ liệu. Các nội dung chính trình bày trong chương gồm có: Tổng quan về giai đoạn tiền xử lý dữ liệu, tóm tắt mô tả về dữ liệu, làm sạch dữ liệu, tích hợp dữ liệu, biến đổi dữ liệu, thu giảm dữ liệu,. . | Chương 2: Các vấn đề tiền xử lý dữ liệu Khai phá dữ liệu (Data mining) Nội dung 2.1. Tổng quan về giai đoạn tiền xử lý dữ liệu 2.2. Tóm tắt mô tả về dữ liệu 2.3. Làm sạch dữ liệu 2.4. Tích hợp dữ liệu 2.5. Biến đổi dữ liệu 2.6. Thu giảm dữ liệu 2.7. Rời rạc hóa dữ liệu 2.8. Tạo cây phân cấp ý niệm 2.9. Tóm tắt 2.1. Tổng quan về giai đoạn tiền xử lý dữ liệu Giai đoạn tiền xử lý dữ liệu Quá trình xử lý dữ liệu thô/gốc (raw/original data) nhằm cải thiện chất lượng dữ liệu (quality of the data) và do đó, cải thiện chất lượng của kết quả khai phá. Dữ liệu thô/gốc Có cấu trúc, bán cấu trúc, phi cấu trúc Được đưa vào từ các nguồn dữ liệu trong các hệ thống xử lý tập tin (file processing systems) và/hay các hệ thống cơ sở dữ liệu (database systems) Chất lượng dữ liệu (data quality): tính chính xác, tính hiện hành, tính toàn vẹn, tính nhất quán Redman (1996), Data Quality in the Information Age, Artech House 2.1. Tổng quan về giai đoạn tiền xử lý dữ liệu Chất lượng dữ liệu (data quality) tính chính xác (accuracy): giá trị được ghi nhận đúng với giá trị thực. tính hiện hành (currency/timeliness): giá trị được ghi nhận không bị lỗi thời. tính toàn vẹn (completeness): tất cả các giá trị dành cho một biến/thuộc tính đều được ghi nhận. tính nhất quán (consistency): tất cả giá trị dữ liệu đều được biểu diễn như nhau trong tất cả các trường hợp. Redman (1996), Data Quality in the Information Age, Artech House Richard Y. Wang, Veda C. Storey, Christopher P. Firth (1995), A framework for analysis of data quality research, IEEE Transactions on knowledge and data engineering, 7(4), pp. 623-640. Accuracy which occurs when the recorded value is in conformity with the actual value Timeliness which occurs when the recorded value is not out of date Completeness which occurs when all values for a certain variable are recorded Consistency which occurs when the representation of the data value is the same in all cases 2.1. Tổng quan về giai đoạn tiền xử lý | Chương 2: Các vấn đề tiền xử lý dữ liệu Khai phá dữ liệu (Data mining) Nội dung 2.1. Tổng quan về giai đoạn tiền xử lý dữ liệu 2.2. Tóm tắt mô tả về dữ liệu 2.3. Làm sạch dữ liệu 2.4. Tích hợp dữ liệu 2.5. Biến đổi dữ liệu 2.6. Thu giảm dữ liệu 2.7. Rời rạc hóa dữ liệu 2.8. Tạo cây phân cấp ý niệm 2.9. Tóm tắt 2.1. Tổng quan về giai đoạn tiền xử lý dữ liệu Giai đoạn tiền xử lý dữ liệu Quá trình xử lý dữ liệu thô/gốc (raw/original data) nhằm cải thiện chất lượng dữ liệu (quality of the data) và do đó, cải thiện chất lượng của kết quả khai phá. Dữ liệu thô/gốc Có cấu trúc, bán cấu trúc, phi cấu trúc Được đưa vào từ các nguồn dữ liệu trong các hệ thống xử lý tập tin (file processing systems) và/hay các hệ thống cơ sở dữ liệu (database systems) Chất lượng dữ liệu (data quality): tính chính xác, tính hiện hành, tính toàn vẹn, tính nhất quán Redman (1996), Data Quality in the Information Age, Artech House 2.1. Tổng quan về giai đoạn tiền xử lý dữ liệu Chất lượng

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.