TAILIEUCHUNG - Đánh giá các kỹ thuật lựa chọn đặc trưng cho bài toán phân loại biểu hiện gen

Bài viết Đánh giá các kỹ thuật lựa chọn đặc trưng cho bài toán phân loại biểu hiện gen trình bày xác định các gen có khả năng gây bệnh là một thách thức lớn trong nghiên cứu về biểu hiện gen. Nhiều phương pháp lựa chọn gen chỉ tập trung vào việc đánh giá sự liên hệ của từng gen riêng biệt với bệnh. Thực tế, một trong những nguyên nhân gây ra các bệnh được cho là liên quan tới những tương tác phức tạp giữa các gen,. . | Vietnam J. Agri. Sci. 2016, Vol. 14, No. 3: 461-468 Tạp chí KH Nông nghiệp Việt Nam 2016, tập 14, số 3: 461-468 ĐÁNH GIÁ CÁC KỸ THUẬT LỰA CHỌN ĐẶC TRƯNG CHO BÀI TOÁN PHÂN LOẠI BIỂU HIỆN GEN Phan Thị Thu Hồng*, Nguyễn Thị Thủy Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam Email*: hongptvn@ Ngày gửi bài: Ngày chấp nhận: TÓM TẮT Xác định các gen có khả năng gây bệnh là một thách thức lớn trong nghiên cứu về biểu hiện gen. Nhiều phương pháp lựa chọn gen chỉ tập trung vào việc đánh giá sự liên hệ của từng gen riêng biệt với bệnh. Thực tế, một trong những nguyên nhân gây ra các bệnh được cho là liên quan tới những tương tác phức tạp giữa các gen. Phương pháp rừng ngẫu nhiên (RF) gần đây đã được ứng dụng thành công trong việc xác định một số nhân tố di truyền có ảnh hưởng lớn tới một số bệnh. Tuy nhiên mô hình này chỉ hiệu quả đối với một số tập dữ liệu có cỡ trung bình nhưng lại hạn chế trong việc xác định các gen có ý nghĩa và xây dựng các mô hình dự đoán chính xác cho dữ liệu có số chiều lớn. Trong bài báo này chúng tôi tập trung vào các phương pháp rừng ngẫu nhiên cải tiến cho phép chọn ra một tập nhỏ các đặc trưng có liên hệ chặt chẽ với biến đích, do đó làm giảm số chiều và có thể xử lý tốt trên các tập dữ liệu có số chiều cao. Hiệu năng của các mô hình này được phân tích để tìm ra phương pháp phân lớp hiệu quả với từng mục tiêu như độ chính xác hay tập các gen có ý nghĩa dựa vào kết quả thử nghiệm trên 8 tập dữ liệu biểu hiện gen được lấy từ ngân hàng dữ liệu y sinh (Kent Ridge) và tin sinh (Bioinformatics). Từ khóa: Dữ liệu biểu hiện gen, lựa chọn đặc trưng, phân loại, rừng ngẫu nhiên, rừng ngẫu nhiên điều hòa, rừng ngẫu nhiên điều hòa có điều hướng, rừng ngẫu nhiên có điều hướng. Evaluation of Feature Selection Methods for Gene Expression Data Classifcation ABSTRACT Selection of relevant genes that have effects in some diseases is a challenging task in gene expression studies. Most gene selection .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.