Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Công Nghệ Thông Tin
Hệ điều hành
Near duplicate document detection survey
TAILIEUCHUNG - Near duplicate document detection survey
Search engines are the major breakthrough on the web for retrieving the information. But List of retrieved documents contains a high percentage of duplicated and near document result. So there is the need to improve the performance of search results. Some of current search engine use data filtering algorithm which can eliminate duplicate and near duplicate documents to save the users’ time and effort. | ISSN:2249-5789 Bassma S Alsulami et al, International Journal of Computer Science & Communication Networks,Vol 2(2), 147-151 Near Duplicate Document Detection Survey Bassma S. Alsulami, Maysoon F. Abulkhair, Fathy E. Eassa Faculty of Computing and Information Technology King AbdulAziz University Jeddah, Saudi Arabia Abstract—Search engines are the major breakthrough on the web for retrieving the information. But List of retrieved documents contains a high percentage of duplicated and near document result. So there is the need to improve the performance of search results. Some of current search engine use data filtering algorithm which can eliminate duplicate and near duplicate documents to save the users’ time and effort. The identification of similar or near-duplicate pairs in a large collection is a significant problem with wide-spread applications. In this paper survey present an up-to-date review of the existing literature in duplicate and near duplicate detection in Web. Keyword—Duplicate document, near duplicate pages, near duplicate detection, Detection approaches 1. INTRODUCTION Information on the Web is very huge in size. There is a need to use this big volume of information efficiently for effectively satisfying the information need of the user on the Web. Search engines become the major breakthrough on the web for retrieving the information. Where, among users looking for information on the Web, 85% submit information requests to various Internet search engines. Search engines are critically important to help users find relevant information on the Web. Search engines in response to a user's query typically produces the list of documents ranked according to closest to the user's request. These documents are presented to the user for examination and evaluation. Web users have to go through the long list and inspect the titles, and snippets sequentially to recognize the required results. Filtering the search engines' results consumes the users' effort and
Thùy Giang
79
5
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Securing the sip communications with XML security mechanisms in VoIP application awareness
7
102
0
Proposing minimum performance of proposed topology in Plateau State University
6
107
0
Performance evaluation of manet protocols in communications and management of robots in simulation modelling
12
59
0
Deployment of voip communications in B&A spy agency: Design and implementation
8
94
2
A proposed architecture and protocol stack for improving QoS in wide vehicular communications
11
75
0
An enhanced data security with compression for manets
6
71
0
Wireless local area network security enhancement through penetration testing
16
86
0
Increasing the lifetime of wireless sensor networks by selforganizing map algorithm
8
64
0
A cloud computing architecture with wireless sensor networks for agricultural applications
5
71
0
Adaptive scheme for outliers detection in wireless sensor networks
10
77
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
461864
55
Giới thiệu :Lập trình mã nguồn mở
14
22634
59
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10884
529
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10064
446
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9518
104
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8279
1125
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8230
423
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7864
2220
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
6683
253
Vật lý hạt cơ bản (1)
29
5769
85
TỪ KHÓA LIÊN QUAN
Hệ điều hành
International Journal of Computer Networks and Communications Security
Near duplicate document detection survey
Near duplicate pages
Near duplicate detection
The major breakthrough
Securing the sip communications with XML security mechanisms
VoIP application awareness
Question of confidentiality and integrity
Client authentication and data confidentiality
Proposing minimum performance of proposed topology
Plateau State University
Computer networks and Communications Security
Performance evaluation of manet protocols in communications
Management of robots in simulation modelling
Manet protocols in communications
End To End Delay
Show network optimization rate including PDR
Deployment of voip communications in B&A spy agency
Design and implementation
Voip communications in B&A spy agency
VoIP simulated in OPNET
Proposed architecture and protocol stack for improving QoS
Wide vehicular communications
Vehicle to Vehicle
An enhanced data security with compression for manets
Enhanced data security
Self organizing networks
Wireless local area network security enhancement through penetration testing
WLANs to achieve
The frame security
The standard network security
Increasing the lifetime of wireless sensor networks
Selforganizing map algorithm
Wireless sensor networks
Self organizing map neural networks
Cloud computing architecture
Wireless sensor networks for agricultural applications
Wireless sensor actor networks
Adaptive scheme for outliers detection in wireless sensor networks
The Quality of Service
Given sensor networks
Infrared sensor and FBUS technology
House security system based on mobile phone
House security system
Secure the place
Potential applications of linear wireless sensor networks
Linear wireless sensor networks
LWSN in various applications
LWSN in network topology
Time dependent finite state machine
Method for intrusion detection in mobile ad hoc networks
Mobile ad hoc networks
Malicious behavior in AODV
Performance analysis of multimedia traffic
MPLS communication networks with traffic engineering
MPLS communication networks
Conventional IP network
Inter cluster communication in wireless sensor networks
Inter cluster communication
Carrying out efficient diffusion
Cluster merging and cluster diffusion
An optimized model for transition from Ipv4 to Ipv6 networks
Cloud computing environment
Ipv4 to Ipv6 networks
Identical traffic and network loads
The optical communications
Simulating an optical high debit transmission chain
Optisystem with comparison of optical windows
Comparison of optical windows
New unicast routing algorithm for load balancing
Multigateway wireless mesh networks
Negative percent algorithms
Wireless mesh networks
Detection of service attack
Defense against distributed denial of service attack
Packet filtration in wireless sensor networks
An advance security technique challenges to government
Wireless sensor network for health
Emphasize ongoing treatment challenges
Wireless sensor network
Medical information systems
The security of information in financial transactions via mobile
Financial transactions via mobile
Implement a particular algorithm
A comprehensive approach to security requirements engineering
Incorporating the strengths
Best practices found
Evaluation of security function of flipora plug in on browsers
Flipora plug in on browsers
Plug in in upon
Flipora plug in
Multi perspective analysis framework
Multi level analysis framework
Network security situational awareness
Multi data analyzing researc
Improving security and performance in the tor network
The tor network
IP hidden in the server
TÀI LIỆU MỚI ĐĂNG
Đánh giá hao mòn và độ tin cậy của chi tiết và kết cấu trên đầu máy diezel part 3
12
304
0
26-04-2024
Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# Tập 2 - Chương 4
47
246
1
26-04-2024
Bơm máy nén quạt trong công nghệ part 1
20
249
2
26-04-2024
Anh văn bằng C-124
8
173
0
26-04-2024
THE ANTHROPOLOGY OF ONLINE COMMUNITIES BY Samuel M.Wilson and Leighton C. Peterson
19
144
0
26-04-2024
Lịch sử Đội TNTP Hồ Chí Minh - CHƯƠNG III VÂNG LỜI BÁC DẠY, LÀM NGHÌN VIỆC TỐT, CHỐNG MỸ, CỨU NƯỚC, THIẾU NIÊN SĂN SÀNG
45
137
0
26-04-2024
Hướng dẫn sử dụng Quickoffice cho Ipad và Iphone
13
151
0
26-04-2024
Khurana et al. Journal of Orthopaedic Surgery and Research 2010, 5:23
7
133
0
26-04-2024
Báo cáo tốt nghiệp: Vận hành và bảo dưỡng trong MPLS
92
144
3
26-04-2024
Diseases of the Liver and Biliary System - part 1
33
123
0
26-04-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
7864
2220
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
5722
1368
Ebook Chào con ba mẹ đã sẵn sàng
112
3767
1231
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
5318
1136
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8279
1125
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3498
643
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
10884
529
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3683
525
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4045
514
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4127
480
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.