Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Luận Văn - Báo Cáo
Báo cáo khoa học
Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
TAILIEUCHUNG - Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
Distributional similarity is a classic technique for entity set expansion, where the system is given a set of seed entities of a particular class, and is asked to expand the set using a corpus to obtain more entities of the same class as represented by the seeds. This paper shows that a machine learning model called positive and unlabeled learning (PU learning) can model the set expansion problem better. Based on the test results of 10 corpora, we show that a PU learning technique outperformed distributional similarity significantly. . | Distributional Similarity vs. PU Learning for Entity Set Expansion Xiao-Li Li Institute for Infocomm Research 1 Fusionopolis Way 21-01 Connexis Singapore 138632 xlli@ Bing Liu University of Illinois at Chicago 851 South Morgan Street Chicago Chicago IL 60607-7053 UsA liub@ Abstract Distributional similarity is a classic technique for entity set expansion where the system is given a set of seed entities of a particular class and is asked to expand the set using a corpus to obtain more entities of the same class as represented by the seeds. This paper shows that a machine learning model called positive and unlabeled learning PU learning can model the set expansion problem better. Based on the test results of 10 corpora we show that a PU learning technique outperformed distributional similarity significantly. 1 Introduction The entity set expansion problem is defined as follows Given a set s of seed entities of a particular class and a set D of candidate entities . extracted from a text corpus we wish to determine which of the entities in D belong to s. In other words we expand the set s based on the given seeds. This is clearly a classification problem which requires arriving at a binary decision for each entity in D belonging to s or not . However in practice the problem is often solved as a ranking problem . ranking the entities in D based on their likelihoods of belonging to s. The classic method for solving this problem is based on distributional similarity Pantel et al. 2009 Lee 1998 . The approach works by comparing the similarity of the surrounding word distributions of each candidate entity with the seed entities and then ranking the candidate entities using their similarity scores. Lei Zhang University of Illinois at Chicago 851 South Morgan Street Chicago Chicago IL 60607-7053 UsA zhang3@ See-Kiong Ng Institute for Infocomm Research 1 Fusionopolis Way 21-01 Connexis Singapore 138632 skng@ In .
Ánh Trang
71
6
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Báo cáo khoa học: "Measures of Distributional Similarity"
8
74
1
Báo cáo khoa học: "Verb Classification using Distributional Similarity in Syntactic and Semantic Structures"
10
60
0
Báo cáo khoa học: "Distributional Similarity vs. PU Learning for Entity Set Expansion"
6
64
0
Báo cáo khoa học: "Reducing semantic drift with bagging and distributional similarity"
9
46
0
Báo cáo khoa học: "Scaling Distributional Similarity to Large Corpora"
8
47
0
Báo cáo khoa học: "Exploring Distributional Similarity Based Models for Query Spelling Correction"
8
58
0
Báo cáo khoa học: "Directional Distributional Similarity for Lexical Expansion"
4
45
0
Báo cáo khoa học: "Integrating Pattern-based and Distributional Similarity Methods for Lexical Entailment Acquisition"
8
48
0
Báo cáo khoa học: "Syntax is from Mars while Semantics from Venus! Insights from Spectral Analysis of Distributional Similarity Networks"
4
63
0
Báo cáo khoa học: "Finding Synonyms Using Automatic Word Alignment and Measures of Distributional Similarity"
8
48
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461857
55
Giới thiệu :Lập trình mã nguồn mở
14
22593
58
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10882
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10047
445
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9513
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8267
1124
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8216
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7862
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6669
253
Vật lý hạt cơ bản (1)
29
5765
85
TỪ KHÓA LIÊN QUAN
Báo cáo khoa học
Distributional Similarity
PU Learning
Entity Set Expansion
báo cáo khoa học
báo cáo ngôn ngữ
ngôn ngữ tự nhiên
Measures of Distributional Similarity
Measures of Distributional Similarity Lillian Lee
Long Papers
mô hình ngôn ngữ
xử lý ngôn ngữ tự nhiên
Verb Classification
Syntactic and Semantic Structures
Reducing semantic drift
bagging and distributional similarity
Tara McIntosh and James R
Curran
Scaling Distributional
Similarity to Large Corpora
James Gorman and James R
Exploring Distributional
Similarity Based Models
Query Spelling Correction
Directional Distributional Similarity
Lexical Expansion
Integrating Pattern based
Distributional Similarity Methods
Lexical Entailment Acquisition
Syntax is from Mars
Semantics from Venus! Insights
Spectral Analysis
Distributional Similarity Networks
Finding Synonyms
Automatic Word Alignment
Distributional Similarity Models
Clustering Neighbors
Lillian Lee
Word classification
combined measures of distributional
semantic similarity
scientific reports
model language
process natural language
Finding Word Substitutions
a Distributional Similarity Baseline
Immediate Context Overlap
Information content
Information theory
Biomedical ontologies
Distributional based methods
BMC Bioinformatics
Identifying biomedical
Empirical risk minimization
Approximate subgraph matching
Distributional similarity model
TÀI LIỆU MỚI ĐĂNG
CẤU TẠO HẠT NHÂN NGUYÊN TỬ-ĐỘ HỤT KHỐI-NĂNG LƯỢNG LIÊN KẾT-LK RIÊNG
12
264
0
24-04-2024
extremetech Hacking BlackBerry phần 9
31
240
0
24-04-2024
MySQL Database Usage & Administration PHẦN 9
37
141
0
24-04-2024
The profit magic of stock Timing The Markets_5
22
118
0
24-04-2024
Đóng mới oto 8 chỗ ngồi part 9
10
116
0
24-04-2024
Báo cáo tốt nghiệp: Vận hành và bảo dưỡng trong MPLS
92
143
3
24-04-2024
Data Structures and Algorithms - Chapter 9: Hashing
54
113
0
24-04-2024
XỬ TRÍ CHẤN THƯƠNG SỌ NÃO KÍN
1
113
1
24-04-2024
Khóa luận tốt nghiệp: Giải pháp nâng cao chất lượng phương thức thanh toán tín dụng chứng từ phục vụ xuất nhập khẩu tại ngân hàng Thương mại Việt Nam - Trần Thị Tân
12
115
0
24-04-2024
Christmas Meditations on the Twelve Holy Days
173
103
0
24-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7862
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5674
1348
Ebook Chào con ba mẹ đã sẵn sàng
112
3757
1230
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5307
1135
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8267
1124
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3483
641
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10882
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3677
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4039
514
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4120
480
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.