TAILIEUCHUNG - Natural Language Processing with Python Phần 5

Nếu ngữ liệu cũng là phân đoạn trong một câu, nó sẽ có một tagged_sents () phương pháp phân chia các từ được gắn thẻ trong một câu chứ không phải là trình bày chúng như một danh sách lớn. | If the corpus is also segmented into sentences it will have a tagged_sents method that divides up the tagged words into sentences rather than presenting them as one big list. This will be useful when we come to developing automatic taggers as they are trained and tested on lists of sentences not words. A Simplified Part-of-Speech Tagset Tagged corpora use many different conventions for tagging words. To help us get started we will be looking at a simplified tagset shown in Table 5-1 . Table 5-1. Simplified part-of-speech tagset Tag Meaning Examples ADJ adjective new good high special big local ADV adverb really already still early now CNJ conjunction and or but if while although DET determiner the a some most every no EX existential there there s FW foreign word dolce ersatz esprit quo maitre MOD modal verb will can would may must should N noun year home costs time education NP proper noun Alison Africa April Washington NUM number twenty-four fourth 1991 14 24 PRO pronoun he their her its my I us P preposition on of at with by into under TO the word to to UH interjection ah bang ha whee hmpf oops V verb is has get do make see run VD past tense said took told made asked VG present participle making going playing working VN past participle given taken begun sung WH wh determiner who which when what where how Tagged Corpora 183 Bangle Rỉ NN WNN hTi TH NNP 4T CC ãTỊrecVNNP None I JJ None WW NN1 t t fo JJ .hjs NN W NN V VM g SYM Hindi TTfrrTrT NNP r r PREP tjr JJ WTHU Vt NN Trsr tr NNPC iqjT NNP hr pREP WVFM tt NN VPREP wt vtt NN VPREP tspr IT PREP NNP jn-r PREP -rraVNVB tVVFM rt VAUX TTftrr NN tT PREP n rf NN TTTmTT NN Tt PREP arWr NN tT PREP Kt ft NN T PREP T rmr PREP wf rr JVB TT VFM TV VAUX Tt VAUX PUNC Marathi fsTFTr NN TĨ5-FTTtrrZ NNPC wW NNP nt srr PRP None íqaròprVNN tjftT NN aira NN r None t NN wrfr VM . SYM Telugu aroWNN mí PREP So a VJJ 3 ạyj NN PREP ii NN Figure 5-1. POS tagged data from four Indian languages Bangla Hindi Marathi and .

TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.