TAILIEUCHUNG - Data Mining Concepts and Techniques phần 7

hoặc một mô hình dự báo để dự đoán chi phí bằng đô la của khách hàng tiềm năng về thiết bị máy tính cho thu nhập và nghề nghiệp của họ. Nhiều phương pháp phân loại và dự báo đã được đề xuất bởi các nhà nghiên cứu trong việc học máy tính, nhận dạng mẫu, và các số liệu thống kê. Hầu hết các thuật toán là cư dân bộ nhớ, thường giả định một kích thước dữ liệu nhỏ. Khai thác dữ liệu nghiên cứu đã xây dựng. | 440 Chapter 7 Cluster Analysis Experiments on PROCLUS show that the method is efficient and scalable at finding high-dimensional clusters. Unlike CLIQUE which outputs many overlapped clusters PROCLUS finds nonoverlapped partitions of points. The discovered clusters may help better understand the high-dimensional data and facilitate other subsequence analyses. Frequent Pattern-Based Clustering Methods This section looks at how methods of frequent pattern mining can be applied to clustering resulting in frequent pattern-based cluster analysis. Frequent pattern mining as the name implies searches for patterns such as sets of items or objects that occur frequently in large data sets. Frequent pattern mining can lead to the discovery of interesting associations and correlations among data objects. Methods for frequent pattern mining were introduced in Chapter 5. The idea behind frequent pattern-based cluster analysis is that the frequent patterns discovered may also indicate clusters. Frequent pattern-based cluster analysis is well suited to high-dimensional data. It can be viewed as an extension of the dimension-growth subspace clustering approach. However the boundaries of different dimensions are not obvious since here they are represented by sets of frequent itemsets. That is rather than growing the clusters dimension by dimension we grow sets of frequent itemsets which eventually lead to cluster descriptions. Typical examples of frequent pattern-based cluster analysis include the clustering of text documents that contain thousands of distinct keywords and the analysis of microarray data that contain tens of thousands of measured values or features. In this section we examine two forms of frequent pattern-based cluster analysis frequent term-based text clustering and clustering by pattern similarity in microarray data analysis. In frequent term-based text clustering text documents are clustered based on the frequent terms they contain. Using the vocabulary of

Gia Bình 42 78 pdf

Upload

Không thể tạo bản xem trước, hãy bấm tải xuống

Tải xuống

TÀI LIỆU LIÊN QUAN

Tự học nhanh và hiệu quả SQL Server 7.0 part 6

30 92 2

Tự học nhanh và hiệu quả SQL Server 7.0 part 7

30 94 0

Tự học nhanh và hiệu quả SQL Server 7.0 part 8

30 102 0

Tự học nhanh và hiệu quả SQL Server 7.0 part 9

30 98 0

Tự học nhanh và hiệu quả SQL Server 7.0 part 10

28 96 0

Tự học nhanh và hiệu quả SQL Server 7.0 part 1

30 105 2

Tự học nhanh và hiệu quả SQL Server 7.0 part 2

30 99 2

Tự học nhanh và hiệu quả SQL Server 7.0 part 3

30 85 1

Tự học nhanh và hiệu quả SQL Server 7.0 part 4

30 86 1

Tự học nhanh và hiệu quả SQL Server 7.0 part 5

30 95 1

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 461857 55

Giới thiệu :Lập trình mã nguồn mở

14 22593 58

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10882 529

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10047 445

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9513 104

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8267 1124

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8216 423

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7862 2220

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 6669 253

Vật lý hạt cơ bản (1)

29 5765 85

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Giáo án mầm non chương trình đổi mới: Gia đình vui nhộn

4 310 1 24-04-2024

Giáo án mầm non chương trình đổi mới: Đề tài: Ôn xác định vị trí trên – dưới, trước- sau của đối tượng khác.

8 352 3 24-04-2024

Động cơ đốt trong và máy kéo công nghiêp tập 2 part 8

32 258 0 24-04-2024

Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# Tập 2 - Chương 4

47 246 1 24-04-2024

Mass Transfer in Multiphase Systems and its Applications Part 19

40 255 1 24-04-2024

Trading Strategies Profit Making Techniques For Stock_3

23 183 0 24-04-2024

extremetech Hacking Firefox phần 7

46 187 0 24-04-2024

Anh văn bằng C-124

8 172 0 24-04-2024

Bơm máy nén quạt trong công nghiệp part 8

20 198 2 24-04-2024

MySQL Database Usage & Administration PHẦN 7

37 154 0 24-04-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7862 2220

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 5674 1348

Ebook Chào con ba mẹ đã sẵn sàng

112 3757 1230

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 5307 1135

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8267 1124

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3483 641

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10882 529

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3677 525

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4039 514

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4120 480