TAILIEUCHUNG - Bài giảng Khai phá dữ liệu: Bài 5 - TS. Trần Mạnh Tuấn

Bài giảng Khai phá dữ liệu: Bài 5 Phân lớp dữ liệu cung cấp cho người học những kiến thức như: Tổng quan; Các phương pháp phân lớp dữ liệu. Mời các bạn cùng tham khảo! | KHAI PHÁ DỮ LIỆU Bài 5. Phân lớp dữ liệu Giáo viên TS. Trần Mạnh Tuấn Bộ môn Hệ thống thông tin Khoa Công nghệ thông tin Email tmtuan@ Điện thoai 1 Nội dung Tổng quan Các phương pháp phân lớp dữ liệu 2 Tổng quan 3 Tổng quan 4 Tổng quan 5 Tổng quan 6 Tổng quan Phân lớp dữ liệu Data classification là xếp đối tượng DL vào một trong các lớp đã được xác định trước. Phân lớp gồm 2 bước B ư ớ c 1 Xây dựng mô hình B ư ớ c 2 Vận hành mô hình. 7 Tổng quan Quy trình phân lớp B1 xây dựng mô hình Mô tả tập các lớp xác định trước Tập học huấn luyện các mẫu dành cho xây dựng mô hình. Mỗi mẫu thuộc về 1 lớp đã định nghĩa trước. Tìm luật phân lớp cây quyết định hoặc công thức toán mô tả lớp. B2 Vận hành mô hình Phân lớp các đối tượng chưa biết Xác định độ chính xác của mô hình sử dụng tập dữ liệu kiểm tra độc lập. Độ chính xác chấp nhận được - gt áp dụng mô hình để phân lớp các mẫu chưa xác định được nhãn lớp. 8 Tổng quan 9 Tổng quan 1 0 Tổng quan 1 1 Tổng quan Xây dựng mô hình Mục tiêu mô tả một tập những lớp đã được định nghĩa trước trong đó mỗi bộ hoặc mẫu sẽ được gán về một lớp đã xác định trước bởi thuộc tính nhãn lớp. Tập hợp những bộ được dùng để xây dựng mô hình được gọi là tập dữ liệu học gọi tắt là tập học . Mô hình được biểu diễn dưới dạng luật phân lớp cây quyết định hoặc công thức toán học 1 2 Tổng quan Xây dựng mô hình 1 3 Tổng quan Vận hành mô hình Mục đích là xác định lớp của dữ liệu trong tương lai hoặc phân lớp những đối tượng chưa biết. Trước khi vận hành mô hình cần đánh giá độ chính xác của mô hình trong đó các mẫu kiểm tra đã biết được lớp được đem so sánh với kết quả phân lớp của mô hình. Độ chính xác là phần trăm của số mẫu kiểm tra được phân lớp đúng. Tập kiểm tra và tập học là hai tập độc lập với nhau. 14 Tổng quan Vận hành mô hình 15 Tổng quan 16 Tổng quan 17 Một số phương pháp phân lớp Phân lớp bằng cây quyết định Cây quyết định Gồm các nút trong biểu diễn giá trị thuộc tính Các nhánh biểu diễn đầu ra của kiểm tra Nút lá biểu diễn

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.