TAILIEUCHUNG - A novel L-MER counting method for abundance based binning of metagenomic reads
Trong bài báo này, một phương pháp đếm mới sử dụng các l-mer có độ dài thay đổi được đề xuất, cho phép giải quyết vấn đề lặp lại của các đoạn l-mer ngắn, nhằm cải tiến độ chính xác của các giải pháp phân loại dựa trên độ phong phú. Phần thực nghiệm cho thấy rằng một giải pháp cải tiến của AbundanceBin (một phương pháp phân loại thường được sử dụng) trong đó phương pháp đề xuất được áp dụng cho độ chính xác cao hơn giải pháp ban đầu. | Journal of Computer Science and Cybernetics, , (2014), 267–277 DOI: A NOVEL L-MER COUNTING METHOD FOR ABUNDANCE-BASED BINNING OF METAGENOMIC READS LE VAN VINH1 , TRAN VAN LANG2,3 , TRAN VAN HOAI1 1 HCMC 2 Institute University of Technology, VNU-HCM of Applied Mechanics and Informatics, VAST 3 Lac Hong University, MOET langtv@ Tóm tắt. Phân loại trình tự là bước quan trọng trong quá trình phân tích dữ liệu metagenomic. Trong khi những phương pháp không có giám sát dựa trên đặc trưng hợp thành chỉ hiệu quả cho xử lý trình tự dài, các phương pháp dựa trên độ phong phú thường được sử dụng cho phân loại trình tự ngắn. Những giải pháp phân loại dựa trên độ phong phú hiện nay thường sử dụng tần số l-mer có độ dài cố định để phân loại trình tự vào các nhóm mà các trình tự trong mỗi nhóm thuộc về các hệ gien (hay loài) có độ phong phú tương tự nhau. Tuy nhiên, hiệu năng phân loại của các giải pháp này rất nhạy cảm với độ dài các l-mer, và chúng gặp khó khăn khi phân loại những trình tự thuộc các hệ gien có độ phong phú thấp vì sự lặp lại của các đoạn l-mer ngắn trong các hệ gien này. Trong bài báo này, một phương pháp đếm mới sử dụng các l-mer có độ dài thay đổi được đề xuất, cho phép giải quyết vấn đề lặp lại của các đoạn l-mer ngắn, nhằm cải tiến độ chính xác của các giải pháp phân loại dựa trên độ phong phú. Phần thực nghiệm cho thấy rằng một giải pháp cải tiến của AbundanceBin (một phương pháp phân loại thường được sử dụng) trong đó phương pháp đề xuất được áp dụng cho độ chính xác cao hơn giải pháp ban đầu. Phần mềm hiện thực cho giải pháp này có thể được tải về tại địa chỉ: Từ khóa. metagenomics, phân loại trình tự, đếm l-mer, trình tự DNA, giải mã trình tự thế hệ mới. Abstract. The binning of reads is a crucial step in metagenomic data analysis. While unsupervised methods which are based on composition features are only efficient for long reads, .
đang nạp các trang xem trước