TAILIEUCHUNG - Báo cáo khoa học: "Extracting Hypernym Pairs from the Web"

We apply pattern-based methods for collecting hypernym relations from the web. We compare our approach with hypernym extraction from morphological clues and from large text corpora. We show that the abundance of available data on the web enables obtaining good results with relatively unsophisticated techniques. | Extracting Hypernym Pairs from the Web Erik Tjong Kim Sang ISLA Informatics Institute University of Amsterdam erikt@ Abstract We apply pattern-based methods for collecting hypernym relations from the web. We compare our approach with hypernym extraction from morphological clues and from large text corpora. We show that the abundance of available data on the web enables obtaining good results with relatively unsophisticated techniques. 1 Introduction WordNet is a key lexical resource for natural language applications. However its coverage currently 155k synsets for the English WordNet is far from complete. For languages other than English the available WordNets are considerably smaller like for Dutch with a 44k synset WordNet. Here the lack of coverage creates bigger problems. A manual extension of the WordNets is costly. Currently there is a lot of interest in automatic techniques for updating and extending taxonomies like WordNet. Hearst 1992 was the hrst to apply hxed syntactic patterns like such NP as NP for extracting hypernym-hyponym pairs. Carballo 1999 built noun hierarchies from evidence collected from conjunctions. Pantel Ravichandran and Hovy 2004 learned syntactic patterns for identifying hypernym relations and combined these with clusters built from co-occurrence information. Recently Snow Jurafsky and Ng 2005 generated tens of thousands of hypernym patterns and combined these with noun clusters to generate high-precision suggestions for unknown noun insertion into WordNet Snow et al. 2006 . The previously mentioned papers deal with 165 English. Little work has been done for other languages. IJzereef 2004 used hxed patterns to extract Dutch hypernyms from text and encyclopedias. Van der Plas and Bouma 2005 employed noun distribution characteristics for extending the Dutch part of EuroWordNet. In earlier work different techniques have been applied to large and very large text corpora. Today the web contains more data than the largest .

Tấn Khang 53 4 pdf

Upload

Bấm vào đây để xem trước nội dung

Tải xuống

TÀI LIỆU LIÊN QUAN

Báo cáo khoa học: "Extracting Hypernym Pairs from the Web"

4 44 0

TÀI LIỆU XEM NHIỀU

Một Case Về Hematology (1)

8 461864 55

Giới thiệu :Lập trình mã nguồn mở

14 22635 59

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10884 529

Câu hỏi và đáp án bài tập tình huống Quản trị học

14 10064 446

Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”

3 9519 104

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8280 1125

Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức

16 8230 423

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7864 2220

Đề tài: Dự án kinh doanh thời trang quần áo nữ

17 6686 253

Vật lý hạt cơ bản (1)

29 5770 85

TỪ KHÓA LIÊN QUAN

TÀI LIỆU MỚI ĐĂNG

Giáo án mầm non chương trình đổi mới: Đề tài: Ôn xác định vị trí trên – dưới, trước- sau của đối tượng khác.

8 352 3 26-04-2024

Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# Tập 2 - Chương 4

47 246 1 26-04-2024

CẤU TẠO HẠT NHÂN NGUYÊN TỬ-ĐỘ HỤT KHỐI-NĂNG LƯỢNG LIÊN KẾT-LK RIÊNG

12 266 0 26-04-2024

beginning Ubuntu Linux phần 1

34 212 1 26-04-2024

extremetech Hacking Firefox phần 7

46 187 0 26-04-2024

Trading Strategies Profit Making Techniques For Stock_8

23 175 0 26-04-2024

Magnetic Bearings Theory and Applications phần 2

14 172 0 26-04-2024

Báo cáo nghiên cứu khoa học " KẾT QUẢ NGHIÊN CỨU BƯỚC ĐẦU VỀ THIÊN ĐỊCH CHÂN KHỚP TRÊN CÂY THANH TRÀ Ở THỪA THIÊN HUẾ "

7 175 0 26-04-2024

Bơm máy nén quạt trong công nghiệp part 8

20 198 2 26-04-2024

Posted prices versus bargaining in markets_7

23 155 0 26-04-2024

TÀI LIỆU HOT

Mẫu đơn thông tin ứng viên ngân hàng VIB

8 7864 2220

Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)

152 5722 1368

Ebook Chào con ba mẹ đã sẵn sàng

112 3767 1231

Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1

62 5319 1136

Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)

249 8280 1125

Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu

561 3498 643

Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh

13 10884 529

Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân

122 3684 525

Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm

274 4046 515

Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe

35 4127 480