Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Tổng quan về khai phá dữ liệu và trích chọn thuộc tính. Trình bày nội dung chính của thuật toán phân lớp sử dụng trong luận văn là thuật toán Random Forest và giải thuật di truyền. Trình bày phương pháp đề xuất và hướng giải quyết của luận văn. Trình bày quá trình thực nghiệm và đánh giá kết quả thực nghiệm. | Nghiên cứu xây dựng phương pháp trích chọn thuộc tính nhăm làm tăng hiệu quả phân lớp đôi với dữ liệu đa chiêu Đồng Thị Ngọc Lan Trường Đại học Công nghệ Luận văn Thạc sĩ ngành Công nghệ phần mêm Mã sô 60 48 10 Người hướng dẫn PGS.TS Nguyễn Hà Nam Năm bảo vệ 2011 Abstract Tổng quan vê khai phá dữ liệu và trích chọn thuộc tính. Trình bày nội dung chính của thuật toán phân lớp sử dụng trong luận văn là thuật toán Random Forest và giải thuật di truyên. Trình bày phương pháp đê xuất và hướng giải quyết của luận văn. Trình bày quá trình thực nghiệm và đánh giá kết quả thực nghiệm. Keywords Công nghệ thông tin Thuật toán phân lớp Cơ sở dữ liệu Content CHƯƠNG 1 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ TRÍCH CHỌN THUỘC TÍNH 1.1 Giới thiệu khai phá dữ liệu và trích chọn thuộc tính Khai phá dữ liệu là một khái niệm ra đời từ những cuôi những năm 80 của thế kỷ trước. Nó bao hàm một loạt các kỹ thuật nhăm phát hiện các thông tin có giá trị tiêm ẩn trong tập các dữ liệu lớn.vê bản chất khai phá dữ liệu liên quan đến việc phân tích các dữ liệu và sử dụng các kỹ thuật để tìm ra các mẫu hình có tính chính quy trong tập dữ liệu. Năm 1989 Fayyad Piatestsky-Shapiro và Smyth đã dùng khái niệm Phát hiện tri thức trong cơ sở dữ liệu Kownledge Discovery in Database - KDD để chỉ toàn bộ quá trình phát hiện các tri thức có ích từ các tập dữ liệu lớn 14 . Trong đó khai phá dữ liệu là một bước đặc biệt trong toàn bộ quá trình sử dụng các giải thuật đặc biệt để chiết xuất ra các mẫu hay các mô hình từ dữ liệu. Trong khai phá dữ liệu thì phương pháp trích chọn thuộc tính đóng một vai trò quan trọng trong tiên xử lý sô liệu. Luận văn chủ yếu tập trung vào tìm hiểu 3 nhiệm vụ chính sau Giảm chiều dữ liêu Giảm chiêu dữ liệu là việc làm giảm chiêu của không gian tìm kiếm dữ liệu giảm chi phí thu thập và lưu trữ dữ liệu nâng cao hiệu quả của việc khai phá dữ liệu và làm đơn giản hóa các kết quả khai phá dữ liệu. Trong nhiệm vụ làm giảm chiêu dữ liệu chúng ta cần phân biệt hai khái nhiệm sau Trích chọn .