TAILIEUCHUNG - Data Mining Concepts and Techniques phần 7

hoặc một mô hình dự báo để dự đoán chi phí bằng đô la của khách hàng tiềm năng về thiết bị máy tính cho thu nhập và nghề nghiệp của họ. Nhiều phương pháp phân loại và dự báo đã được đề xuất bởi các nhà nghiên cứu trong việc học máy tính, nhận dạng mẫu, và các số liệu thống kê. Hầu hết các thuật toán là cư dân bộ nhớ, thường giả định một kích thước dữ liệu nhỏ. Khai thác dữ liệu nghiên cứu đã xây dựng. | 440 Chapter 7 Cluster Analysis Experiments on PROCLUS show that the method is efficient and scalable at finding high-dimensional clusters. Unlike CLIQUE which outputs many overlapped clusters PROCLUS finds nonoverlapped partitions of points. The discovered clusters may help better understand the high-dimensional data and facilitate other subsequence analyses. Frequent Pattern-Based Clustering Methods This section looks at how methods of frequent pattern mining can be applied to clustering resulting in frequent pattern-based cluster analysis. Frequent pattern mining as the name implies searches for patterns such as sets of items or objects that occur frequently in large data sets. Frequent pattern mining can lead to the discovery of interesting associations and correlations among data objects. Methods for frequent pattern mining were introduced in Chapter 5. The idea behind frequent pattern-based cluster analysis is that the frequent patterns discovered may also indicate clusters. Frequent pattern-based cluster analysis is well suited to high-dimensional data. It can be viewed as an extension of the dimension-growth subspace clustering approach. However the boundaries of different dimensions are not obvious since here they are represented by sets of frequent itemsets. That is rather than growing the clusters dimension by dimension we grow sets of frequent itemsets which eventually lead to cluster descriptions. Typical examples of frequent pattern-based cluster analysis include the clustering of text documents that contain thousands of distinct keywords and the analysis of microarray data that contain tens of thousands of measured values or features. In this section we examine two forms of frequent pattern-based cluster analysis frequent term-based text clustering and clustering by pattern similarity in microarray data analysis. In frequent term-based text clustering text documents are clustered based on the frequent terms they contain. Using the vocabulary of

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.