Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
TAILIEUCHUNG - Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
Distributional similarity is a classic technique for entity set expansion, where the system is given a set of seed entities of a particular class, and is asked to expand the set using a corpus to obtain more entities of the same class as represented by the seeds. This paper shows that a machine learning model called positive and unlabeled learning (PU learning) can model the set expansion problem better. Based on the test results of 10 corpora, we show that a PU learning technique outperformed distributional similarity significantly. . | Distributional Similarity vs. PU Learning for Entity Set Expansion Xiao-Li Li Institute for Infocomm Research 1 Fusionopolis Way 21-01 Connexis Singapore 138632 xlli@ Bing Liu University of Illinois at Chicago 851 South Morgan Street Chicago Chicago IL 60607-7053 UsA liub@ Abstract Distributional similarity is a classic technique for entity set expansion where the system is given a set of seed entities of a particular class and is asked to expand the set using a corpus to obtain more entities of the same class as represented by the seeds. This paper shows that a machine learning model called positive and unlabeled learning PU learning can model the set expansion problem better. Based on the test results of 10 corpora we show that a PU learning technique outperformed distributional similarity significantly. 1 Introduction The entity set expansion problem is defined as follows Given a set s of seed entities of a particular class and a set D of candidate entities . extracted from a text corpus we wish to determine which of the entities in D belong to s. In other words we expand the set s based on the given seeds. This is clearly a classification problem which requires arriving at a binary decision for each entity in D belonging to s or not . However in practice the problem is often solved as a ranking problem . ranking the entities in D based on their likelihoods of belonging to s. The classic method for solving this problem is based on distributional similarity Pantel et al. 2009 Lee 1998 . The approach works by comparing the similarity of the surrounding word distributions of each candidate entity with the seed entities and then ranking the candidate entities using their similarity scores. Lei Zhang University of Illinois at Chicago 851 South Morgan Street Chicago Chicago IL 60607-7053 UsA zhang3@ See-Kiong Ng Institute for Infocomm Research 1 Fusionopolis Way 21-01 Connexis Singapore 138632 skng@ In .
Ánh Trang
75
6
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Measures of Distributional Similarity"
8
74
1
Báo cáo khoa học: "Verb Classification using Distributional Similarity in Syntactic and Semantic Structures"
10
60
0
Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
6
64
0
Báo cáo khoa học: "Reducing semantic drift with bagging and distributional similarity"
9
46
0
Báo cáo khoa học: "Scaling Distributional Similarity to Large Corpora"
8
47
0
Báo cáo khoa học: "Exploring Distributional Similarity Based Models for Query Spelling Correction"
8
58
0
Báo cáo khoa học: "Directional Distributional Similarity for Lexical Expansion"
4
45
0
Báo cáo khoa học: "Integrating Pattern-based and Distributional Similarity Methods for Lexical Entailment Acquisition"
8
48
0
Báo cáo khoa học: "Syntax is from Mars while Semantics from Venus! Insights from Spectral Analysis of Distributional Similarity Networks"
4
63
0
Báo cáo khoa học: "Finding Synonyms Using Automatic Word Alignment and Measures of Distributional Similarity"
8
48
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462307
61
Giới thiệu :Lập trình mã nguồn mở
14
25017
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11301
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10515
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9800
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8879
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8469
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8093
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7501
1765
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7200
268
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Distributional Similarity
PU Learning
Entity Set Expansion
báo cáo khoa học
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
Measures of Distributional Similarity
Measures of Distributional Similarity Lillian Lee
Long Papers
mô hình ngôn ngữ
xử lý ngôn ngữ tự nhiên
Verb Classification
Syntactic and Semantic Structures
Reducing semantic drift
bagging and distributional similarity
Tara McIntosh and James R
Curran
Scaling Distributional
Similarity to Large Corpora
James Gorman and James R
Exploring Distributional
Similarity Based Models
Query Spelling Correction
Directional Distributional Similarity
Lexical Expansion
Integrating Pattern based
Distributional Similarity Methods
Lexical Entailment Acquisition
Syntax is from Mars
Semantics from Venus! Insights
Spectral Analysis
Distributional Similarity Networks
Finding Synonyms
Automatic Word Alignment
Distributional Similarity Models
Clustering Neighbors
Lillian Lee
Word classification
combined measures of distributional
semantic similarity
scientific reports
model language
process natural language
Finding Word Substitutions
a Distributional Similarity Baseline
Immediate Context Overlap
Information content
Information theory
Biomedical ontologies
Distributional based methods
BMC Bioinformatics
Identifying biomedical
Empirical risk minimization
Approximate subgraph matching
Distributional similarity model
TÀI LIỆU MỚI ĐĂNG
Đóng mới oto 8 chỗ ngồi part 9
10
175
3
02-12-2024
Color Atlas of Ophthamology
165
135
2
02-12-2024
Báo cáo " Thẩm quyền quản lí nhà nước đối với hoạt động quảng cáo thực trạng và hướng hoàn thiện "
7
198
7
02-12-2024
5 thói quen ăn uống hủy hoại hàm răng đẹp
5
161
1
02-12-2024
Báo cáo lâm nghiệp: "Assessment of the effects of below-zero temperatures on photosynthesis and chlorophyll a fluorescence in leaf discs of Eucalyptus globulu"
4
132
0
02-12-2024
Determini prounoun 1
6
136
0
02-12-2024
NGUỒN GỐC CÂY KHOAI LANG
3
122
1
02-12-2024
THUẬT TOÁN LUYỆN KIM SONG SONG (Parallel Simulated Annealing Algorithms) GIẢI QUYẾT BÀI TOÁN MAX-SAT
41
116
1
02-12-2024
English Grammar Tests-Elementary Level's archiveReal Life: Accessories and Clothing (1)
8
114
0
02-12-2024
Báo cáo lâm nghiệp: "Les facteurs de productivité du Pin noir d’Autriche (Pinus nigra Arnold. ssp. nigricans Host. austriaca Hoss. Novak) dans les Alpes du Sud"
17
105
0
02-12-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8093
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7501
1765
Ebook Chào con ba mẹ đã sẵn sàng
112
4370
1369
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6169
1260
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8879
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3801
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3912
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4629
562
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11301
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4463
490
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.