TAILIEUCHUNG - Giảm chiều bằng cách trích chọn đặc trưng cải thiện "quá khớp" cho mạng Nơron với bài toán dự báo

Trong bài báo này các tác giả đề nghị thêm một cách dùng PCA như phương pháp trích chọn đặc trưng để giảm chiều, kết hợp với các giải thuật khai phá dữ liệu nhằm cải thiện sự quá khớp (overfitting) khi áp dụng mạng nơron (Mạng nơron nhân tạo -Artificical Neural Network) cho các bài toán dự báo thuộc tính đích dựa trên có tập mẫu nhỏ với không gian mô tả có số chiều cao. Thực nghiệm chi ra rằng việc kết hợp giữa PCA và ANN tỏ ra khá phù hợp. | Một sể vẩn đề chọn lọc của Câng nghệ thông tin và truyền thỏng Đại Lài Ỉ4-Ỉ5 tháng 9 năm 2007 GIẢM CHIÈU BẰNG TRÍCH CHỌN ĐẶC TRƯNG CẢI THIỆN QUÁ KHỚP CHO MẠNG Nơ RON VỚI BÀI TOÁN Dự BÁO Nguyen Pbuong Nga1 Nguyen Thanh Thuy1 Nguyen Ngoe Binh2 ĩ Khoa CNTT-ĐHBKHN 2 Khoa CNTT-ĐHKHCN- ĐHQGHN Trong các nghiên cứu về phân lớp phân cụm nhiều tác giả đã dùng phương pháp Phân tích thành phần chỉnh Principal Component Analysis -PCA để giỏi quyểt và đạt hiệu quả cao. Trong bài bảo này chúng tôi đề nghị thêm một cách dừng PCA như phtrơng pháp trích chọn đặc trưng để giảm chiều kết hợp với các giải thuật khai phá dữ liệu nhằm cải thiện sự quả khớp overfitting khi áp dụng mạng nơ ron Mạng nơron nhân tạo-Artìficìal Neural Network cho các bài toán dự bảo thuộc tỉnh đích dựa trên cổ tập mẫu nhỏ với không gian mồ tà có số chiều rất cao. Thực nghiệm chi ra rằng việc kết hợp giữa PCA và ANN tỏ ra khá phù hợp. 1. Giới thiệu vấn đề Nhiều tác giả đã nghiên cứu và áp dụng khá thành công phương pháp PCA cho phân lớp phân cụm nén dữ liệu 1 2 3 4 . . Trong nghiên cứu này chúng tôi mong muốn hướng tới sử dụng PCA cho các bài toán khá quan trọng của thực tế công nghệ - dự báo các thuộc tính đích dựa trên tập mẫu khổng lớn với không gian mô tả có sổ chiều rất cao. Đây là một trong các dạng thường gặp của bài toán mô hình hoá gặp nhiều trong khai phá dữ liệu thuộc các lĩnh vực khoa học công nghệ. Việc áp dụng các giải thuật khai phá dữ liệu truyền thống trở nên rất khỏ khăn thậm chí không xử lý nồi do lượng thông tin khổng lồ tăng rắt nhanh cả về số mẫu quan sát và sổ chiều của tập dữ liệu. Trích chọn đặc trưng là một giải pháp hữu hiệu có vai trò giảm mạnh sự quá tải cho các giải thuật khai phá dữ liệu. Với bài toán mô hình hoá thuộc dạng dự báo trong lĩnh vực Hoá lượng tử việc giải quyết bàng công cụ mạng noron là khá phù hợp. ANN cho phép học trên các mẫu sau đó dự báo nhưng không đòi hỏi bất kỳ một giả thiết thống kê nào. Tuy nhiên khi phải học trên tập mẫu nhỏ vài chục mẫu nhưng sổ chiều mô

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.