TAILIEUCHUNG - Bài giảng Khai phá web - Bài 2: Học máy (Phần 3)

Bài giảng Khai phá web - Bài 2: Học máy (Phần 3). Bài này cung cấp cho học viên những nội dung về: các khái niệm cơ bản; thuật toán k-means; biểu diễn cụm; phân cụm phân cấp; hàm khoảng cách; chuẩn hóa dữ liệu; xử lý nhiều loại thuộc tính; . Mời các bạn cùng tham khảo chi tiết nội dung bài giảng! | BÀI 2 HỌC MÁY TIẾP Nội dung 1. Các khái niệm cơ bản 2. Thuật toán k-means 3. Biểu diễn cụm 4. Phân cụm phân cấp 5. Hàm khoảng cách 6. Chuẩn hóa dữ liệu 7. Xử lý nhiều loại thuộc tính 8. Phương pháp đánh giá 9. Khám phá các lỗ và vùng dữ liệu 10. Học LU 11. Học PU 1. Các k n cơ bản Phân cụm là quá trình tổ chức các phần tử DL thành các nhóm trong đó các thành viên có tính chất tương tự nhau. Mỗi cụm bao gồm các phần tử DL tương tự nhau và khác biệt so với các phần tử DL thuộc các nhóm khác Ứng dụng phân cụm nhóm khách hàng dựa theo sở thích để thiết kế chiến lược marketing phân cụm khách hàng dựa theo chỉ số cơ thể để bố trí sản xuất quần áo phân cụm bài báo để tổng hợp tin tức . 2. Thuật toán k-means Algorithm k-means k D 1 chọn k điểm DL làm centroid trung tâm của cụm 2 repeat 3 for mỗi điểm DL x D do 4 tính khoảng cách từ x tới mỗi centroid 5 gán x cho centroid gần nhất một centroid đại diện cho một cụm 6 endfor 7 tính toán lại các centroid dựa trên các cụm hiện tại 8 until the stopping criterion is met Thuật toan K-means tiếp Điều kiện hội tụ 1. Số điểm DL được gán lại nhỏ hơn một ngưỡng 2. Số centroid bị thay đổi nhỏ hơn một ngưỡng 3. Tổng bình phương lỗi nhỏ hơn một ngưỡng trong đó - k là số lượng cụm - Cj là cụm thứ j - mj là centroid của Cj véc-tơ trung bình của các điểm DL thuộc Cj - dist x mj là khoảng cách giữa x và mj A Lựa chọn ngẫu nhiên k centroid Vòng lặp 1 B Gán cụm C Tính lại centroid Vòng lặp 2 D Gán cụm E Tính lại centroid Vòng lặp 3 F Gán cụm G Tính lại centroid Thuật toán K-Means tiếp Algorithm disk-k-means k D 1 Chọn k điểm DL làm centroid mj j 1 . k 2 repeat 3 khởi tạo sj 0 j 1 . k 0 là véc-tơ với các thành phần bằng 0 4 khởi tạo nj 0 j 1 . k nj là số điểm trong cụm j 5 for mỗi điểm DL x D do 6 j argmin dist x mi 7 gán x cho cụm j 8 sj sj x 9 nj nj 1 10 endfor 11 mj sj nj j 1 . k 12 until đ k dừng thỏa mãn Thuật toán K-Means tiếp O tkn trong đó t là số vòng lặp k là số cụm n là số ví dụ trong DL huấn luyện Chỉ áp dụng cho DL tồn tại mean đối

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.