Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Công Nghệ Thông Tin
Cơ sở dữ liệu
Phương pháp mới dựa trên vùng an toàn nâng cao hiệu quả phân lớp dữ liệu mất cân bằng
TAILIEUCHUNG - Phương pháp mới dựa trên vùng an toàn nâng cao hiệu quả phân lớp dữ liệu mất cân bằng
Bài viết nghiên cứu cách thức tăng (giảm) phần tử của lớp mất cân bằng dựa trên một mức độ “an toàn”. Từ đó, đề xuất một phương pháp mới vừa tăng số lượng các phần tử an toàn ở lớp thiểu số, vừa giảm các phần tử an toàn ở mức đa số. | PHƯƠNG PHÁP MỚI DỰA TRÊN VÙNG AN TOÀN NÂNG CAO HIỆU QUẢ PHÂN LỚP DỮ LIỆU MẤT CÂN BẰNG BÙI DƯƠNG HƯNG 1 NGUYỄN THỊ HỒNG , ĐẶNG XUÂN THỌ 2 1 Khoa Tin học, Trường Đại học Công đoàn 2 Khoa Công nghệ Thông tin, Trường Đại học Sư phạm Hà Nội Email: thodx@ 2 Tóm tắt: Nghiên cứu bài toán phân lớp trong thực tế như chuẩn đoán y học, phát hiện sự cố tràn dầu, phát hiện gian lận kinh tế tài chính ngày càng được nhiều nhà khoa học quan tâm vì tầm ảnh hưởng lớn của những lĩnh vực này tới con người. Tuy nhiên, nhiều nghiên cứu đã chỉ ra hiệu quả phân lớp của các bài toán này chưa cao do có sự chênh lệch về số lượng phần tử giữa các lớp dữ liệu. Một yêu cầu đặt ra là cần có những hướng tiếp cận mới đối với trường hợp dữ liệu mất cân bằng để tăng tính hiệu quả phân lớp chính xác của thuật toán phân lớp. Bài báo của chúng tôi đề xuất ba thuật toán mới dựa trên mức an toàn nhằm nâng cao hiệu quả phân lớp dữ liệu. Hai thuật toán, Random Safe Oversampling (RSO) và Random Safe Undersampling (RSU) cải tiến trực tiếp từ Random Oversamling và Random Undersampling. Thuật toán thứ ba, Random Safe Over-Undersampling (RSOU) là sự kết hợp của RSO và RSU nhằm đồng thời vừa tăng thêm các phần tử ở lớp thiểu số vừa loại bỏ các phần tử ở lớp đa số ở các vùng an toàn. Từ khóa: Dữ liệu mất cân bằng; Phân lớp dữ liệu; Safe level; Random Oversampling; Random Undersampling; Random Safe Oversampling; Random Safe Undersampling 1. MỞ ĐẦU Ngày nay, một số lượng lớn của dữ liệu được thu thập và lưu trữ trong các cơ sở dữ liệu ở khắp mọi nơi trên thế giới. Không khó để tìm được các cơ sở dữ liệu lên tới Terabytes trong các doanh nghiệp và các trung tâm nghiên cứu [1], [2]. Rất nhiều thông tin và kiến thức vô giá tiềm ẩn trong các cơ sở dữ liệu như vậy, mà chưa có phương pháp tự động hiệu quả để phân tách thông tin [3]. Trong suốt nhiều năm, nhiều thuật toán được tạo ra để phân tách những gì được gọi là “quặng vàng” của tri thức từ các tập dữ liệu lớn. Đặc biệt, trong đó vấn đề phân lớp mất cân
Thanh Hảo
116
10
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Random Border Undersampling: Thuật toán mới giảm phần tử ngẫu nhiên trên đường biên trong dữ liệu mất cân bằng
8
65
0
Khai thác luật phân lớp kết hợp trên cơ sở dữ liệu mất cân bằng về lớp
7
51
2
Luận văn Thạc sĩ Kỹ thuật: Nghiên cứu phân lớp trên dữ liệu mất cân bằng và ứng dụng
65
45
5
Tài liệu hướng dẫn thực hành môn Cấu trúc dữ liệu và giải thuật - Bài 5: Cây cân bằng AVL
7
106
0
Bài giảng Cấu trúc dữ liệu và giải thuật: Cây AVL - ĐHKHTN
13
138
1
Phương pháp mới dựa trên vùng an toàn nâng cao hiệu quả phân lớp dữ liệu mất cân bằng
10
91
0
Phương pháp mới dựa trên đường biên và vùng an toàn nâng cao hiệu quả phân lớp dữ liệu mất cân bằng
9
76
0
Ứng dụng kỹ thuật học máy trên dữ liệu mất cân bằng hỗ trợ dự đoán sớm khả năng thôi học của học sinh trung học phổ thông
10
62
1
Tóm tắt Luận văn Thạc sĩ: Nghiên cứu phân lớp trên dữ liệu mất cân bằng và ứng dụng
26
22
1
Thuật toán HMU trong bài toán phân lớp dữ liệu mất cân bằng
8
107
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461860
55
Giới thiệu :Lập trình mã nguồn mở
14
22613
59
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10883
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10060
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9515
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8274
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8225
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7863
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6669
253
Vật lý hạt cơ bản (1)
29
5767
85
TỪ KHÓA LIÊN QUAN
Cơ sở dữ liệu
Dữ liệu mất cân bằng
Phân lớp dữ liệu
Random Undersampling
Random Safe Oversampling
Random Safe Undersampling
Random Border Undersampling
Thuật toán mới giảm phần tử ngẫu nhiên
Đường biên dữ liệu mất cân bằng giới
Mất cân bằng dữ liệu
Tăng phần tử
Khai thác luật phân lớp
Cơ sở dữ liệu mất cân bằng về lớp
Cơ sở dữ liệu
Thuộc tính lớp
Luận văn Thạc sĩ Kỹ thuật
Khoa học máy tính
Hiệu năng phân lớp dữ liệu
Dữ liệu phân bố không cân bằng
Cấu trúc dữ liệu
Bài giảng Cấu trúc dữ liệu
Cây cân bằng AVL
Cây nhị phân tìm kiếm
Xử lý mất cân bằng bằng
Các node trên cây cân bằng
Bài giảng Cấu trúc dữ liệu và giải thuật
Cách xây dựng cây cân bằng
Các trường hợp mất cân bằng cây AVL
Xử lý mất cân bằng cây AVL
Thao tác trên cây AVL
Mức độ an toàn
Sinh thêm phần tử ngẫu nhiên
Giảm bớt phần tử ngẫu nhiên
Khai phá dữ liệu
Cây quyết định
Mô hình học máy
Giải thuật AdaBoost
Tóm tắt Luận văn Thạc sĩ
Nghiên cứu phân lớp
Thuật toán HMU
Phương pháp làm giảm số lượng phần tử
Lề giả thuyết
Số lượng phần tử
Cải thiện hiệu suất phân lớp
Hypothesis margin
Thuật toán HBU
Phân lớp microRNA
Border line
Random Sampling
Over Sampling
Thuật toán mới Random Border Over Sampling
Tạp chí Nghiên cứu khoa học
Phương pháp DEC SVM phân lớp
Mẫu nhân tạo lớp thiểu số
Sinh ngẫu nhiên phần tử lớp thiểu số
Bộ lọc tái lấy mẫu
Loại bỏ nhiễu
Thuật toán SMOTE
Xử lý dữ liệu mất cân bằng
Chấm điểm tín dụng
Quản trị rủi ro tín dụng
Ngân hàng thương mại Việt Nam
Kỹ thuật lấy mẫu dưới
Cấu trúc dữ liệu và giải thuật
Cây nhị phân tìm kiếm cân bằng
Mất cân bằng cây nhị phân
Dữ liệu có số chiều cao
Bình phương tối thiểu từng phần
Sinh thêm phần tử nhân tạo
Bộ dữ liệu chuẩn từ nguồn UCI
Ung thư da
Ung thư hắc tố
Phương pháp gán trọng số động
Hàm mất mát Large Margin Cosine Loss
Tập dữ liệu HAM10000
Phát hiện gian lận tài chính
Gian lận trong tài chính
Bài toán phát hiện gian lận tài chính
Kỹ thuật khai phá dữ liệu
Pin mặt trời
Phương pháp DEC SVM
Phân lớp dữ liệu mất cân bằng
Thiết kế bộ điều khiển thích nghi trượt
Robot công nghiệp
Phân loại văn bản
Chất lượng đào tạo đại học
Máy học vector hỗ trợ
Cây quyết định
TÀI LIỆU MỚI ĐĂNG
Giáo án mầm non chương trình đổi mới: Gia đình vui nhộn
4
312
1
25-04-2024
Giáo án mầm non chương trình đổi mới: Đề tài: Ôn xác định vị trí trên – dưới, trước- sau của đối tượng khác.
8
352
3
25-04-2024
Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# Tập 2 - Chương 4
47
246
1
25-04-2024
Mass Transfer in Multiphase Systems and its Applications Part 19
40
255
1
25-04-2024
extremetech Hacking BlackBerry phần 9
31
248
0
25-04-2024
BeginningMac OS X Tiger Dashboard Widget Development 2006 phần 2
34
208
0
25-04-2024
extremetech Hacking Firefox phần 7
46
187
0
25-04-2024
Magnetic Bearings Theory and Applications phần 2
14
170
0
25-04-2024
Posted prices versus bargaining in markets_7
23
155
0
25-04-2024
The profit magic of stock Timing The Markets_5
22
119
0
25-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7863
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5695
1353
Ebook Chào con ba mẹ đã sẵn sàng
112
3764
1231
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5311
1135
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8274
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3492
642
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10883
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3679
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4041
514
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4123
480
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.