TAILIEUCHUNG - Báo cáo khoa học: "The Linguistic Annotation System of the Stockholm"

Our poster presents results and experiences from the application of the system to 300,000 word forms, a subpart of a larger corpus. The application of the system is carried out in two steps, an automatic lexical look up followed by homograph separation, which is done partly automatically, partly manually. Lexical and morphological analysis and disambiguation of Swedish is a rather complicated task, a fact which should hold for several other languages as well. Below a sample text is given, showing both the amount of information that has to be specified for each word form and the degree of. | The Linguistic Annotation System of the Stockholm Umea Corpus Project Gunnel Kãllgren Gunnar Eriksson Institute of Linguistics Stockholm University S-106 91 Stockholm gunnel@ gunnar@ In the Stockholm - Umeâ Corpus project sue we have developed and applied a system for representing lexical and morphological information about word forms in unrestricted text. Our poster presents results and experiences from the application of the system to 300 000 word forms a subpart of a larger corpus. The application of the system is carried out in two steps an automatic lexical look up followed by homograph separation which is done partly automatically partly manually. Lexical and morphological analysis and disambiguation of Swedish is a rather complicated task a fact which should hold for several other languages as well. Below a sample text is given showing both the amount of information that has to be specified for each word form and the degree of ambiguity to be resolved. sjalv 161 sjalv NN NEU SIN IND NON sjalv NN NEU PLU IND NON sjalv JJ POS UTR SIN IND NON sjalv PM NOM rokar 162 râka VB PRS ART rAk NN UTR PLU IND NOM hon 163 hon PN UTR SIN DEF SUB ho NN UTR SIN DEF NON ut 164 ut AB fõr 165 for pp for AB for SN for KI for MN UTR SIN IND MOM for VB PRS AKT for VB IMP ART kAkfarare 167 kAk_farare NN UTR SIN IND NOM kAkjfarare NN UTR PLU IND NOM som 168 som HP------ som HA son KN misshandlar 169 miss-handla VB PRS ART miss-handel NN UTR PLU IND NON och 170 och KN fòrồd jukar 171 forodnjuka VB PRS ART henne 172 hon PI UTR SIN DEF OBJ en 166 en DT UTR SIN IND en RG UTR SIN IND ION n PI UTR SIN IND SUB OBJ en AB an IN UTR SII IND I0M .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.