TAILIEUCHUNG - Giải thuật rừng ngẫu nhiên với luật gán nhãn cục bộ cho phân lớp

Bài viết Giải thuật rừng ngẫu nhiên với luật gán nhãn cục bộ cho phân lớp đề xuất sử dụng luật gán nhãn cục bộ trong giải thuật rừng ngẫu nhiên để nâng cao hiệu quả phân lớp. Kết quả cho thấy phân loại tốt khi so sánh với rừng ngẫu nhiên của cây quyết định và máy học véctơ hỗ trợ dựa trên các tiêu chí Precision, Recall, F1, Accuracy. | Kỷ yếu Hội nghị Quốc gia lần thứ VIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 GIẢI THUẬT RỪNG NGẪU NHIÊN VỚI LUẬT GÁN NHÃN CỤC BỘ CHO PHÂN LỚP Đỗ Thanh Nghị, Phạm Nguyên Khang, Nguyễn Hữu Hòa, Nguyễn Minh Trung Khoa CNTT-TT, Trường ĐHCT dtnghi@ TÓM TẮT - Trong bài viết này, chúng tôi đề xuất sử dụng luật gán nhãn cục bộ trong giải thuật rừng ngẫu nhiên để nâng cao hiệu quả phân lớp. Giải thuật rừng ngẫu nhiên của Breiman đề xuất là giải thuật phân lớp chính xác khi so sánh với các giải thuật học có giám sát hiện nay. Tuy nhiên, do sử dụng luật bình chọn số đông ở nút lá của cây quyết định làm dự báo của rừng ngẫu nhiên giảm hiệu quả. Để cải thiện kết quả dự báo của rừng ngẫu nhiên, chúng tôi đề xuất thay thế luật bình chọn số đông bởi luật gán nhãn cục bộ, k láng giềng. Kết quả thử nghiệm trên các tập dữ liệu gen từ website cho thấy rằng giải thuật rừng ngẫu nhiên sử dụng luật gán nhãn cục bộ do chúng tôi đề xuất cho kết quả phân loại tốt khi so sánh với rừng ngẫu nhiên của cây quyết định và máy học véctơ hỗ trợ dựa trên các tiêu chí Precision, Recall, F1, Accuracy. Từ khóa - Rừng ngẫu nhiên, cây quyết định, luật gán nhãn, luật cục bộ, k láng giềng, phân lớp dữ liệu nhiều chiều. I. GIỚI THIỆU Phân lớp dữ liệu hay học có giám sát là một trong bốn nhóm bài toán quan trọng của khám phá tri thức và khai mỏ dữ liệu [Han et al., 2011]. Phân lớp dữ liệu xây dựng mô hình phân lớp từ tập dữ liệu có nhãn (lớp) đã được định nghĩa trước, để thực hiện gán nhãn tự động cho từng phần tử dữ liệu mới đến. Phân lớp dữ liệu có số chiều lớn được biết là một trong 10 vấn đề khó của cộng đồng khai mỏ dữ liệu [Yang & Wu, 2006]. Mô hình học phân lớp thường cho kết quả tốt trong khi học nhưng lại cho kết quả rất thấp trong tập kiểm tra. Vấn đề khó khăn thường gặp chính là số chiều quá lớn và dữ liệu thường tách rời nhau trong không gian có số chiều lớn việc tìm mô hình phân lớp tốt có

Việt Quyết 115 9 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Luận văn Thạc sĩ Quản lý tài nguyên rừng: Thực trạng và đề xuất giải pháp nâng cao hiệu quả trồng rừng ngập mặn tại thị xã Quảng Yên, Quảng Ninh giai đoạn 1998- 2018

98 80 2

Luận văn Thạc sĩ Khoa học lâm nghiệp: Đánh giá thực trạng rừng trồng keo ở Quảng Ninh và Bắc Giang làm cơ sở đề xuất các giải pháp trồng rừng gỗ lớn ở vùng Đông Bắc Bộ

88 59 3

Luận văn Thạc sĩ Khoa học lâm nghiệp: Đề xuất một số giải pháp kỹ thuật phục hồi rừng thứ sinh nghèo trên núi đá vôi tại vùng đệm Vườn quốc gia Cát Bà

81 39 1

Luận văn Thạc sĩ Khoa học lâm nghiệp: Nghiên cứu một số đặc điểm cấu trúc rừng thứ sinh nghèo và đề xuất giải pháp kỹ thuật phục hồi rừng tại huyện Hoành Bồ tỉnh Quảng Ninh

142 24 1

Luận văn Thạc sĩ Lâm học: Nghiên cứu cấu trúc và giải pháp bảo vệ, phục hồi rừng tự nhiên có loài Nghiến phân bố tập trung ở tỉnh Điện Biên

93 56 1

Bài giảng Phương pháp nghiên cứu khoa học: Giải thuật rừng ngẫu nhiên xiên phân (RF-ODT) cho phân lớp dữ liệu có số chiều lớn

40 89 0

Luận văn: NGHIÊN CỨU MỘT SỐ CƠ SỞ KHOA HỌC NHẰM ĐỀ XUẤT CÁC GIẢI PHÁP KỸ THUẬT GÂY TRỒNG RỪNG NGẬP MẶN CHO VÙNG BÃI BỒI VEN BIỂN HUYỆN KIM SƠN, TỈNH NINH BÌNH

1 48 0

Nghiên cứu khoa học " Nghiên cứu các giải pháp kinh tế, kỹ thuật tổng hợp nhằm khôi phục và phát triển Rừng ngập mặn và rừng Tràm tại một số vùng phân bố ở Việt Nam "

16 79 0

Thực trạng và một số giải pháp nâng cao hiệu quả Quản lý Rừng tại Trại thực nghiệm, trường cung cấp nghề điện và kỹ thuật Nông lâm Đông Bắc

6 106 0

Luận văn Thạc sĩ Lâm nghiệp: Nghiên cứu hiện trạng và đề xuất giải pháp quản lý, kĩ thuật trồng rừng loài bời lời đỏ (Machilus odoratissima Nees) ở huyện Nam Trà My, tỉnh Quảng Nam

101 32 1

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 462341 61

Giới thiệu :Lập trình mã nguồn mở

14 26046 79

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11346 542

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10551 466

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9842 108

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8891 1161

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8505 426

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8101 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7747 1790

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 7264 268

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Đóng mới oto 8 chỗ ngồi part 9

10 179 3 27-12-2024

báo cáo hóa học:" Increased androgen receptor expression in serous carcinoma of the ovary is associated with an improved survival"

6 156 3 27-12-2024

Báo cáo nghiên cứu nông nghiệp " Field control of pest fruit flies in Vietnam "

14 191 4 27-12-2024

Chương 10: Các phương pháp tính quá trình quá độ trong mạch điện tuyến tính

57 233 7 27-12-2024

Hướng dẫn chế độ dinh dưỡng cho người bệnh viêm khớp

5 168 2 27-12-2024

Sử dụng mô hình ARCH và GARCH để phân tích và dự báo về giá cổ phiếu trên thị trường chứng khoán

24 1073 2 27-12-2024

Đề tài " Dự báo về tác động của Tổ chức Thương mại Thế giới WTO đối với các doanh nghiệp xuất khẩu vừa và nhỏ Việt Nam – Những giải pháp đề xuất "

72 185 2 27-12-2024

Báo cáo y học: "The Factors Influencing Depression Endpoints Research (FINDER) study: final results of Italian patients with depressio"

9 149 1 27-12-2024

Báo cáo " Bàn về hành vi pháp luật và hành vi đạo đức "

11 179 2 27-12-2024

ETHICAL CODE HANDBOOK: Demonstrate your commitment to high standards

7 147 1 27-12-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 8101 2279

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 7747 1790

Ebook Chào con ba mẹ đã sẵn sàng

112 4407 1371

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 6284 1266

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8891 1161

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3840 680

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3920 609

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4709 565

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 11346 542

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4509 490