TAILIEUCHUNG - Báo cáo khoa học: "Bayesian Symbol-Refined Tree Substitution Grammars for Syntactic Parsing"

We propose Symbol-Refined Tree Substitution Grammars (SR-TSGs) for syntactic parsing. An SR-TSG is an extension of the conventional TSG model where each nonterminal symbol can be refined (subcategorized) to fit the training data. We aim to provide a unified model where TSG rules and symbol refinement are learned from training data in a fully automatic and consistent fashion. | Bayesian Symbol-Refined Tree Substitution Grammars for Syntactic Parsing Hiroyuki Shindo Yusuke Miyao Akinori Fujino Masaaki Nagata NTT Communication Science Laboratories NTT Corporation 2-4 Hikaridai Seika-cho Soraku-gun Kyoto Japan @ National Institute of Informatics 2-1-2 Hitotsubashi Chiyoda-ku Tokyo Japan yusuke@ Abstract We propose Symbol-Refined Tree Substitution Grammars SR-TSGs for syntactic parsing. An SR-TSG is an extension of the conventional TSG model where each nonterminal symbol can be refined subcategorized to fit the training data. We aim to provide a unified model where TSG rules and symbol refinement are learned from training data in a fully automatic and consistent fashion. We present a novel probabilistic SR-TSG model based on the hierarchical Pitman-Yor Process to encode backoff smoothing from a fine-grained SR-TSG to simpler CFG rules and develop an efficient training method based on Markov Chain Monte Carlo MCMC sampling. Our SR-TSG parser achieves an F1 score of in the Wall Street Journal WSJ English Penn Treebank parsing task which is a point improvement over a conventional Bayesian TSG parser and better than state-of-the-art discriminative reranking parsers. 1 Introduction Syntactic parsing has played a central role in natural language processing. The resulting syntactic analysis can be used for various applications such as machine translation Galley et al. 2004 DeNeefe and Knight 2009 sentence compression Cohn and La-pata 2009 Yamangil and Shieber 2010 and question answering Wang et al. 2007 . Probabilistic context-free grammar PCFG underlies many statistical parsers however it is well known that the PCFG rules extracted from treebank data via maximum likelihood estimation do not perform well due to unrealistic context freedom assumptions Klein and Manning 2003 . 440 In recent years there has been an increasing interest in tree substitution grammar TSG as an .

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.