Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Công Nghệ Thông Tin
Hệ điều hành
Near duplicate document detection survey
TAILIEUCHUNG - Near duplicate document detection survey
Search engines are the major breakthrough on the web for retrieving the information. But List of retrieved documents contains a high percentage of duplicated and near document result. So there is the need to improve the performance of search results. Some of current search engine use data filtering algorithm which can eliminate duplicate and near duplicate documents to save the users’ time and effort. | ISSN:2249-5789 Bassma S Alsulami et al, International Journal of Computer Science & Communication Networks,Vol 2(2), 147-151 Near Duplicate Document Detection Survey Bassma S. Alsulami, Maysoon F. Abulkhair, Fathy E. Eassa Faculty of Computing and Information Technology King AbdulAziz University Jeddah, Saudi Arabia Abstract—Search engines are the major breakthrough on the web for retrieving the information. But List of retrieved documents contains a high percentage of duplicated and near document result. So there is the need to improve the performance of search results. Some of current search engine use data filtering algorithm which can eliminate duplicate and near duplicate documents to save the users’ time and effort. The identification of similar or near-duplicate pairs in a large collection is a significant problem with wide-spread applications. In this paper survey present an up-to-date review of the existing literature in duplicate and near duplicate detection in Web. Keyword—Duplicate document, near duplicate pages, near duplicate detection, Detection approaches 1. INTRODUCTION Information on the Web is very huge in size. There is a need to use this big volume of information efficiently for effectively satisfying the information need of the user on the Web. Search engines become the major breakthrough on the web for retrieving the information. Where, among users looking for information on the Web, 85% submit information requests to various Internet search engines. Search engines are critically important to help users find relevant information on the Web. Search engines in response to a user's query typically produces the list of documents ranked according to closest to the user's request. These documents are presented to the user for examination and evaluation. Web users have to go through the long list and inspect the titles, and snippets sequentially to recognize the required results. Filtering the search engines' results consumes the users' effort and
Thùy Giang
94
5
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Securing the sip communications with XML security mechanisms in VoIP application awareness
7
102
0
Proposing minimum performance of proposed topology in Plateau State University
6
107
0
Performance evaluation of manet protocols in communications and management of robots in simulation modelling
12
59
0
Deployment of voip communications in B&A spy agency: Design and implementation
8
94
2
A proposed architecture and protocol stack for improving QoS in wide vehicular communications
11
75
0
An enhanced data security with compression for manets
6
71
0
Wireless local area network security enhancement through penetration testing
16
86
0
Increasing the lifetime of wireless sensor networks by selforganizing map algorithm
8
64
0
A cloud computing architecture with wireless sensor networks for agricultural applications
5
71
0
Adaptive scheme for outliers detection in wireless sensor networks
10
77
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462386
61
Giới thiệu :Lập trình mã nguồn mở
14
27275
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11388
543
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10588
468
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9870
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8914
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8538
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8114
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
8076
1836
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7322
268
TỪ KHÓA LIÊN QUAN
Hệ điều hành
International Journal of Computer Networks and Communications Security
Near duplicate document detection survey
Near duplicate pages
Near duplicate detection
The major breakthrough
Securing the sip communications with XML security mechanisms
VoIP application awareness
Question of confidentiality and integrity
Client authentication and data confidentiality
Proposing minimum performance of proposed topology
Plateau State University
Computer networks and Communications Security
Performance evaluation of manet protocols in communications
Management of robots in simulation modelling
Manet protocols in communications
End To End Delay
Show network optimization rate including PDR
Deployment of voip communications in B&A spy agency
Design and implementation
Voip communications in B&A spy agency
VoIP simulated in OPNET
Proposed architecture and protocol stack for improving QoS
Wide vehicular communications
Vehicle to Vehicle
An enhanced data security with compression for manets
Enhanced data security
Self organizing networks
Wireless local area network security enhancement through penetration testing
WLANs to achieve
The frame security
The standard network security
Increasing the lifetime of wireless sensor networks
Selforganizing map algorithm
Wireless sensor networks
Self organizing map neural networks
Cloud computing architecture
Wireless sensor networks for agricultural applications
Wireless sensor actor networks
Adaptive scheme for outliers detection in wireless sensor networks
The Quality of Service
Given sensor networks
Infrared sensor and FBUS technology
House security system based on mobile phone
House security system
Secure the place
Potential applications of linear wireless sensor networks
Linear wireless sensor networks
LWSN in various applications
LWSN in network topology
Time dependent finite state machine
Method for intrusion detection in mobile ad hoc networks
Mobile ad hoc networks
Malicious behavior in AODV
Performance analysis of multimedia traffic
MPLS communication networks with traffic engineering
MPLS communication networks
Conventional IP network
Inter cluster communication in wireless sensor networks
Inter cluster communication
Carrying out efficient diffusion
Cluster merging and cluster diffusion
An optimized model for transition from Ipv4 to Ipv6 networks
Cloud computing environment
Ipv4 to Ipv6 networks
Identical traffic and network loads
The optical communications
Simulating an optical high debit transmission chain
Optisystem with comparison of optical windows
Comparison of optical windows
New unicast routing algorithm for load balancing
Multigateway wireless mesh networks
Negative percent algorithms
Wireless mesh networks
Detection of service attack
Defense against distributed denial of service attack
Packet filtration in wireless sensor networks
An advance security technique challenges to government
Wireless sensor network for health
Emphasize ongoing treatment challenges
Wireless sensor network
Medical information systems
The security of information in financial transactions via mobile
Financial transactions via mobile
Implement a particular algorithm
A comprehensive approach to security requirements engineering
Incorporating the strengths
Best practices found
Evaluation of security function of flipora plug in on browsers
Flipora plug in on browsers
Plug in in upon
Flipora plug in
Multi perspective analysis framework
Multi level analysis framework
Network security situational awareness
Multi data analyzing researc
Improving security and performance in the tor network
The tor network
IP hidden in the server
TÀI LIỆU MỚI ĐĂNG
THE ANTHROPOLOGY OF ONLINE COMMUNITIES BY Samuel M.Wilson and Leighton C. Peterson
19
232
4
23-01-2025
B2B Content Marketing: 2012 Benchmarks, Budgets & Trends
17
243
3
23-01-2025
Đóng mới oto 8 chỗ ngồi part 9
10
189
3
23-01-2025
Giáo trình phân tích phương trình vi phân viết dưới dạng thuật toán đặc tính của hệ thống p1
5
171
1
23-01-2025
Bảng màu theo chữ cái – V
11
177
2
23-01-2025
ĐỀ TÀI " ĐÁNH GIÁ HIỆU QUẢ HOẠT ĐỘNG KINH DOANH NGOẠI HỐI CỦA NGÂN HÀNG THƯƠNG MẠI CỔ PHẦN XUẤT NHẬP KHẨU VIỆT NAM "
51
160
3
23-01-2025
Lập trình Java cơ bản : Luồng và xử lý file part 8
5
143
1
23-01-2025
Xinh xinh vườn nhà
6
135
0
23-01-2025
Lịch sử Trung Quốc 5000 năm tập 3 part 2
54
160
1
23-01-2025
TRẮC NGHIỆM - CÁC BỆNH THIẾU DINH DƯỠNG THƯỜNG GẶP
32
221
2
23-01-2025
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8114
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
8076
1836
Ebook Chào con ba mẹ đã sẵn sàng
112
4475
1381
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6463
1285
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8914
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3883
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3934
613
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4833
568
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11388
543
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4551
490
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.