TAILIEUCHUNG - Phân loại dữ liệu có liên kết sử dụng phương pháp đồng huấn luyện

Trong bài báo này, tác giả đề xuất giải quyết vấn đề kết hợp thông tin liên kết với các dữ liệu khác bằng cách sử dụng kỹ thuật đồng huấn luyện, trong đó các liên kết được coi là một góc nhìn (view) khác của dữ liệu. | Tạp chí Khoa học ĐHQGHN Khoa học Tự nhiên và Công nghệ Tập 30 Số 4 2014 48-57 Phân loại dữ liệu có liên kết sử dụng phương pháp đồng huấn luyện Nguyễn Việt Tân1 Hoàng Vũ2 Đặng Vũ Tùng3 Từ Minh Phương4 Đại học Công nghệ ĐHQGHN 144 Xuân Thủy Cầu Giấy Hà Nội Việt Nam 2 Viện Công nghệ thông tin ĐHQGHN 144 Xuân Thủy Hà Nội Việt Nam 3 Học viện Thanh thiếu niên Việt Nam 5 Chùa Láng Đống Đa Hà Nội Việt Nam 2 Học viện Công nghệ Bưu chính Viễn thông 122 Hoàng Quốc Việt Cầu Giấy Hà Nội Việt Nam Nhận ngày 10 tháng 10 năm 2014 Chỉnh sửa ngày 18 tháng 11 năm 2014 Chấp nhận đăng ngày 22 tháng 12 năm 2014 Tóm tắt Trong một số ứng dụng phân loại tự động bên cạnh các dữ liệu dạng vector còn có dữ liệu liên kết thể hiện quan hệ giữa các đối tượng như trang web được nối bởi các siêu liên kết bài báo khoa học được liên kết bởi các tài liệu tham khảo các nút mạng được kết nối vật lý .. Yêu cầu đặt ra với thuật toán phân loại là tận dụng và kết hợp dữ liệu liên kết với các thông tin khác để cho kết quả dự đoán chính xác hơn. Nhiều nghiên cứu trước đây đã giải quyết vấn đề này bằng cách sử dụng các thuật toán dựa trên đồ thị mà tiêu biểu là bộ phân lớp Gaussian-field các mạng Hopfield và bộ phân lớp quan hệ láng . Trong bài báo này chúng tôi đề xuất giải quyết vấn đề kết hợp thông tin liên kết với các dữ liệu khác bằng cách sử dụng kỹ thuật đồng huấn luyện trong đó các liên kết được coi là một góc nhìn view khác của dữ liệu. Phương pháp được thử nghiệm trên bộ dữ liệu WebKB. Kết quả thử nghiệm và so sánh cho thấy phương pháp đề xuất cho kết quả phân loại chính xác hơn phương pháp kết hợp dữ liệu liên kết dựa trên đồ thị. Từ khóa Đồng huấn luyện dữ liệu liên kết 1. Giới thiệu Phân loại hay phân lớp là kỹ thuật khai phá dữ liệu được nghiên cứu và sử dụng rộng rãi. Đây là phần quan trọng trong các dạng ứng dụng như phân loại văn bản nhận dạng chữ viết giọng nói phân loại protein . Trên thực tế tồn tại một số bài toán trong đó giữa các đối tượng cần phân lớp có các liên kết Tác

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.