TAILIEUCHUNG - Biodiversity Databases: Techniques, Politics, and Applications - Chapter 6

Mô tả phân loại là sản lượng cốt lõi của hệ thống học nghiên cứu và tầm quan trọng cho các câu hỏi quan trọng trong các lĩnh vực sinh học, khoa học trái đất, và khoa học môi trường. Những mô tả này có chứa một lượng lớn các thông tin về các đặc tính hình thái của sinh vật trên trái đất, phân bố địa lý của họ, và hóa thạch, lịch sử địa chất của họ. Phần lớn những dữ liệu này không phổ biến rộng rãi cho người sử dụng rất nhiều tiềm năng bởi vì họ chủ yếu là công. | 6 Automated Extraction of Biodiversity Data from Taxonomic Descriptions Gordon B. Curry and Richard J. Connor CONTENTS Scope of the Historical Legacy of How to Get Information from Taxonomic Descriptions into a Basic The Spectrum from Nonstructured to Structured Electronic Conventions of Taxonomic Automatic Extraction of Information from Taxonomic Querying XML-Tagged Advantage of Using XML Tagging to Extract Taxonomic Applicability of the The Future. .80 Acknowledgments .81 References .81 ABSTRACT Taxonomic descriptions are the core output of systematics research and of critical importance for key questions in the fields of biology earth science and environmental science. These descriptions contain vast amounts of information about the morphological features of organisms on Earth their geographic distribution and for fossils their geological history. Much of these data are not widely available to the many potential users because they are predominantly published as hard copy in systematics journals or monographs. Digitization of these descriptions would make them much more widely available but doing this manually would be an enormous and unrealistic task. This chapter describes an alternative method of automating the digitization of taxonomic descriptions using new techniques in computing science that exploit the high degree of structure and organization imposed by systematic convention and rigorous editorial procedures. The method involves parsing such partially structured text to generate XML tags around discrete sections of the text. Once tagged complex queries can be run across the data that were not possible with the non-tagged text and the tagged text can more readily be imported into an existing data 63 2007 by Taylor Francis Group LLC 64 Biodiversity Databases .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.