TAILIEUCHUNG - Thuật toán phân cụm dữ liệu mờ

Khai phá dữ liệu (Datamining) là quá trình trích xuất các thông tin có giá trị tiềm ẩn bên trong tập dữ liệu lớn được lưu trữ trong các cơ sở dữ liệu, kho dữ liệu. Người ta định nghĩa: "Phân cụm dữ liệu là một kỹ thuật trong DATA MINING, nhằm tìm kiếm, phát hiện các cụm, các mẫu dữ liệu tự nhiên tiềm ẩn, quan tâm trong tập dữ liệu lớn, từ đó cung cấp thông tin, tri thức hữu ích cho việc ra quyết định" Như vậy , PCDL là quá trình phân chia một tập dữ. | Tài liệu chi xem đươc một số trang đầu. Vui lòng download file gốc để xem toàn bộ các trang Thuật toán phân cụm dữ liệu mờ CHƯƠNG 1. TỔNG QUAN VỀ PHÂN CỤM DỮ LIỆU . Khái niệm chung Khai phá dữ liệu Datamining là quá trình trích xuất các thông tin có giá trị tiềm ẩn bên trong tập dữ liệu lớn được lưu trữ trong các cơ sở dữ liệu kho dữ liệu. Người ta định nghĩa Phân cụm dữ liệu là một kỹ thuật trong DATA MINING nhằm tìm kiếm phát hiện các cụm các mẫu dữ liệu tự nhiên tiềm ẩn quan tâm trong tập dữ liệu lớn từ đó cung cấp thông tin tri thức hữu ích cho việc ra quyết định Như vậy PCDL là quá trình phân chia một tập dữ liệu ban đầu thành các cụm dữ liệu sao cho các phần tử trong một cụm tương tự Similar với nhau và các phần tử trong các cụm khác nhau sẽ phi tương tự Dissimilar với nhau. Số các cụm dữ liệu được phân ở đây có thể được xác định trước theo kinh nghiệm hoặc có thể được tự động xác định. . Các kiểu dữ liệu và độ đo tương tự a. Phân loại các kiểu dữ liệu Cho một CSDL D chứa n đối tượng trong không gian k chiều trong đó x y z là các đối tượng thuộc D x xi x2 . xk y yi y2 . yk z zi Z2 . Zk trong đó xi yi Zị với i 1 k là các đặc trưng hoặc thuộc tính tương ứng của các đối tượng x y z. Sau đây là các kiểu dữ liệu Phân loại các kiểu dữ liệu dựa trên kích thước miền -I- Thuộc tính liên tục Continuous Attribute nếu miền giá trị của nó là vô hạn không đếm được -I- Thuộc tính rời rạc DiscretteAttribute Nếu miền giá trị của nó là tập hữu hạn đếm được -I- Lớp các thuộc tính nhị phân là trường hợp đặc biệt của thuộc tính rời rạc mà miền giá trị của nó chỉ có 2 phần tử được diễn tả như Yes No hoặc Nam Nữ False true . Trang 1 Tài liệu chi xem đươc một số trang đầu. Vui lòng download file góc để xem toàn bộ các trang Thuật toán phân cụm dữ liệu mờ Phân loại các kiểu dữ liệu dựa trên hệ đo Giả sử rằng chúng ta có hai đối tượng X y và các thuộc tính Xị yi tương ứng với thuộc tính thứ i của chúng. Chúng ta có các lớp kiểu dữ liệu như sau -I- Thuộc tính định danh nominal .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.