TAILIEUCHUNG - Báo cáo y học: "Quake: quality-aware detection and correction of sequencing errors"

Tuyển tập các báo cáo nghiên cứu về y học được đăng trên tạp chí y học Wertheim cung cấp cho các bạn kiến thức về ngành y đề tài: Quake: quality-aware detection and correction of sequencing errors. | Kelley et al. Genome Biology 2010 11 R116 http 2010 11 11 R116 Genome Biology SOFTWARE Open Access Quake quality-aware detection and correction of sequencing errors David R Kelley1 Michael C Schatz2 Steven L Salzberg1 Abstract We introduce Quake a program to detect and correct errors in DNA sequencing reads. Using a maximum likelihood approach incorporating quality values and nucleotide specific miscall rates Quake achieves the highest accuracy on realistically simulated reads. We further demonstrate substantial improvements in de novo assembly and SNP detection after using Quake. Quake can be used for any size project including more than one billion human reads and is freely available as open source software from http software quake. Rationale Massively parallel DNA sequencing has become a prominent tool in biological research 1 2 . The high-throughput and low cost of second-generation sequencing technologies has allowed researchers to address an ever-larger set of biological and biomedical problems. For example the 1000 Genomes Project is using sequencing to discover all common variations in the human genome 3 . The Genome 10K Project plans to sequence and assemble the genomes of 10 000 vertebrate species 4 . Sequencing is now being applied to a wide variety of tumor samples in an effort to identify mutations associated with cancer 5 6 . Common to all of these projects is the paramount need to accurately sequence the sample DNA. DNA sequence reads from Illumina sequencers one of the most successful of the second-generation technologies range from 35 to 125 bp in length. Although sequence fidelity is high the primary errors are substitution errors at rates of as we show in our experiments with errors rising in frequency at the 3 ends of reads. Sequencing errors complicate analysis which normally requires that reads be aligned to each other for genome assembly or to a reference genome for detection of mutations . Mistakes

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.