Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Công Nghệ Thông Tin
Cơ sở dữ liệu
Một phương pháp lựa chọn thuộc tính gom cụm sử dụng lý thuyết thông tin
TAILIEUCHUNG - Một phương pháp lựa chọn thuộc tính gom cụm sử dụng lý thuyết thông tin
Bài viết trình bày việc xem xét ba kỹ thuật dựa trên lý thuyết tập thô: TR (Total Roughness), MMR (Min-Min Roughness) và MDA (Maximum Dependency Attribute), và đề xuất một thuật toán mới MAX-MEAN-SU (Maximum Mean of Symmetric Uncertainties), cho việc lựa chọn thuộc tính phân cụm theo tiếp cận phân cấp. | Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin FAIR Huế ngày 07-08 6 2019 DOI MỘT PHƯƠNG PHÁP LỰA CHỌN THUỘC TÍNH GOM CỤM SỬ DỤNG LÝ THUYẾT THÔNG TIN Phạm Công Xuyên Nguyễn Thanh Tùng Lac Hong University pcxuyen@ nttung@ TÓM TẮT Bài toán gom cụm dữ liệu xuất hiện trong nhiều lĩnh vực khác nhau. Mục tiêu cơ bản của gom cụm là nhóm đối tượng thành các cụm sao cho các đối tượng trong cùng một cụm thì tương tự như nhau hơn là các đối tượng từ các cụm khác nhau. Gần đây nhiều nhà nghiên cứu quan tâm đến vấn đề gom cụm dữ liệu phạm trù categorical trong đó các đối tượng dữ liệu được mô tả bởi các thuộc tính không phải thuộc tính số. Đặc biệt phương pháp gom cụm phân cấp dữ liệu phạm trù sử dụng lý thuyết tập thô đã thu hút nhiều sự chú ý. Chìa khóa của các phương pháp này là làm thế nào để chọn được một thuộc gom cụm tốt nhất tại mỗi thời điểm trong số nhiều thuộc tính ứng viên. Trong bài báo này chúng tôi xem xét ba kỹ thuật dựa trên lý thuyết tập thô TR Total Roughness MMR Min-Min Roughness và MDA Maximum Dependency Attribute và đề xuất một thuật toán mới MAX-MEAN-SU Maximum Mean of Symmetric Uncertainties cho việc lựa chọn thuộc tính phân cụm theo tiếp cận phân cấp. MAX-MEAN-SU sử dụng độ đo SU Symmetric Uncertainty một độ đo lý thuyết thông tin cho phép lượng hóa mức độ tương quan lẫn nhau giữa hai thuộc tính và tìm cách xác định thuộc tính gom cụm sao cho độ tương quan trung bình của nó với các thuộc tính khác đạt giá trị lớn nhất. Để đánh giá và so sánh MAX-MEAN-SU với ba kỹ thuật dựa trên lý thuyết tập thô chúng tôi sử dụng khái niệm Độ tương tự trung bình bên trong các cụm của một phép gom cụm để đo lường chất lượng gom cụm của mỗi thuộc tính được chọn bởi mỗi phương pháp. Kết quả thực nghiệm cho thấy chất lượng gom cụm của thuộc tính chọn được bằng phương pháp MAX-MEAN-SU là cao hơn so với các thuộc tính chọn bởi các phương pháp TR MMR và MDA. Do đó MAX-MEAN-SU có thể .
Quang Dũng
61
9
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Bài giảng Chương 4: Phân loại dữ liệu
56
94
0
Bài giảng Phân tích dữ liệu: Chương 6 - PGS. TS. Nguyễn Thống
33
104
0
Luận văn Thạc sĩ ngành Công nghệ thông tin: Nghiên cứu kỹ thuật phân loại dữ liệu LiDAR
55
178
4
Bài giảng Phân tích dữ liệu: Chương 4 - PGS. TS. Nguyễn Thống
10
94
1
Một lược đồ thủy vân cơ sở dữ liệu quan hệ với dữ liệu phân loại
12
79
0
Ebook Phân tích dữ liệu nghiên cứu với SPSS (Tập 1): Phần 1 - NXB Hồng Đức
145
116
0
Bài giảng Phân tích dữ liệu với SPSS: Chương 1 – Nguyễn Văn Vũ An (ĐH Trà Vinh)
25
72
3
Bài giảng Phân tích dữ liệu với SPSS - TS. Nguyễn Thị Phương Giang
40
54
4
Phân loại lớp phủ bề mặt khu công nghiệp Bắc Thăng Long bằng phương pháp phân loại hướng đối tượng sử dụng dữ liệu ảnh vệ tinh độ phân giải cao Worldview-2
9
74
2
Bài giảng Phân tích và xử lý dữ liệu trong kinh doanh: Chương 1 - Học viện Ngân hàng
39
113
2
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462340
61
Giới thiệu :Lập trình mã nguồn mở
14
26019
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11345
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10550
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9841
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8889
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8504
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8100
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7735
1790
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7263
268
TỪ KHÓA LIÊN QUAN
Cơ sở dữ liệu
Dữ liệu phân loại
Gom cụm phân cấp
Lý thuyết tập thô
Lựa chọn thuộc tính gom cụm
Độ không chắc chắn đối xứng
Phân loại dữ liệu
Bài giảng Phân loại dữ liệu
Cây quyết định
Phân loại dữ liệu với mạng Bayesian
Phân loại dữ liệu với mạng Neural
Phương pháp phân loại dữ liệu
Bài giảng Phân tích dữ liệu
Phân tích dữ liệu
Phân loại thành phần chính
Phân tích thành phần dữ liệu
Luận văn Thạc sĩ
Công nghệ thông tin
Luận văn Thạc sĩ Công nghệ thông tin
Kỹ thuật phân loại dữ liệu LiDAR
Phân loại dữ liệu LiDAR
Kỹ thuật phân khúc
Kỹ thuật thủy vân
Lược đồ thủy vân
Cơ sở dữ liệu quan hệ
Bảo vệ dữ liệu
Thủy vân cơ sở dữ liệu quan hệ
Phân tích dữ liệu nghiên cứu với SPSS
Giới thiệu phân tích dữ liệu
Nhập liệu và một số xử lý trên biến
Làm sạch dữ liệu
Tóm tắt và trình bày dữ liệu
Kiểm định mối liên hệ giữa hai biến
Phân tích dữ liệu với SPSS
Xử lý dữ liệu trên biến
Nguyên tắc mã hóa dữ liệu
Xử lý trên biến
Bài giảng Phân tích dữ liệu với SPSS
Mã hóa dữ liệu
Phương pháp phân loại hướng đối tượng
Ảnh vệ tinh Worldview 2
Tư liệu ảnh Worldview 2
Phân loại lớp phủ
Dữ liệu trắc địa
Xử lý dữ liệu trong kinh doanh
Phân tích dữ liệu trong kinh doanh
Các loại dữ liệu
Nguồn dữ liệu
Phương pháp chọn mẫu
Công cụ phân tích dữ liệu
Bài giảng Cơ sở dữ liệu
Cơ sở dữ liệu
Hệ quản trị cơ sở dữu liệu
Phân loại cơ sở dữ liệu
Chuyển đối loại cơ sở dữ liệu
Khai phá dữ liệu
Bài giảng Khai phá dữ liệu
Data mining
Môi trường và phát triển bền vững
Xây dựng hệ thống dữ liệu
Phân loại cây xanh hoa cảnh
Trang trí cảnh quan đô thị
Hệ thống dữ liệu phân loại cây xanh
Tạp chí Khoa học công nghệ
Khách hàng trực tuyến
Học máy có giám sát
Khai thác dữ liệu bình luận
Phân loại bình luận của khách hàng
Mô hình dữ liệu
Bài giảng các mô hình dữ liệu
Phân loại mô hình dữ liệu
Mô hình dữ liệu mạng
Mô hình dữ liệu quan hệ
Mô hình dữ liệu thực thể
Cấu trúc dữ liệu
Bài giảng Cấu trúc dữ liệu
Cấu trúc dữ liệu và giải thuật
Cấu trúc dữ liệu cây
Kiểu dữ liệu cây
Phân loại cây
Hệ quản trị Cơ sở dữ liệu
Thiết kế cơ sở dữ liệu
Phân loại indexes
Phân loại chỉ mục
Tạo chỉ mục
Khóa luận tốt nghiệp
Ứng dụng kĩ thuật khai phá dữ liệu
Kĩ thuật khai phá dữ liệu
Phân loại khách hàng
Chăm sóc khách hàng
Dữ liệu nhiễu
Phân loại dữ liệu nhiễu
Khai thác dữ liệu nhiễu
Chủng vi nấm phân lập
Khả năng phân giải
Cơ chất sinh học
Phương pháp hình thái
Giải trình tự gen
Dữ liệu khóa phân loại
Dữ liệu genbank
Phân tích dữ liệu thống kê
Loại thang đo
Phân tích đơn biến
Phân tích nhị biến
Phân tích đa biến
Giáo trình Công nghệ Thông tin
Kiểu dữ liệu trừu tượng
Cách cài đặt kiểu dữ liệu trừu tượng
Phân loại kiểu dữ liệu trừu tượng
Bài toán Cấu trúc dữ liệu
Kiểu dữ liệu phức hợp
Bài giảng Kiểu dữ liệu phức hợp
Kiểu dữ liệu đơn giản
Phân loại kiểu dữ liệu phức hợp
Mảng 1 chiều
TÀI LIỆU MỚI ĐĂNG
Data Structures and Algorithms - Chapter 8: Heaps
41
188
5
26-12-2024
Báo cáo nghiên cứu nông nghiệp " Field control of pest fruit flies in Vietnam "
14
190
4
26-12-2024
báo cáo hóa học:" Perceptions of rewards among volunteer caregivers of people living with AIDS working in faith-based organizations in South Africa: a qualitative study"
10
157
1
26-12-2024
Giáo án điện tử tiểu học môn lịch sử: Cách mạng mùa thu
39
164
1
26-12-2024
Đề tài " Dự báo về tác động của Tổ chức Thương mại Thế giới WTO đối với các doanh nghiệp xuất khẩu vừa và nhỏ Việt Nam – Những giải pháp đề xuất "
72
184
2
26-12-2024
Báo cáo " Thẩm quyền quản lí nhà nước đối với hoạt động quảng cáo thực trạng và hướng hoàn thiện "
7
205
7
26-12-2024
Báo cáo " Bàn về hành vi pháp luật và hành vi đạo đức "
11
178
2
26-12-2024
Word Games with English 1
65
137
1
26-12-2024
CUỘC KHÁNG CHIẾN CHỐNG THỰC DÂN PHÁP KẾT THÚC (1953 - 1954)_5
11
146
1
26-12-2024
5 thói quen ăn uống hủy hoại hàm răng đẹp
5
167
1
26-12-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8100
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7735
1790
Ebook Chào con ba mẹ đã sẵn sàng
112
4406
1371
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6283
1266
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8889
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3839
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3919
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4708
565
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11345
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4508
490
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.