Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Sức khỏe - Y tế
Văn bản luật
Nông Lâm Ngư
Kỹ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Tài liệu HOT
Tìm
Danh mục
Kinh doanh - Marketing
Kinh tế quản lý
Biểu mẫu - Văn bản
Tài chính - Ngân hàng
Công nghệ thông tin
Tiếng anh ngoại ngữ
Kĩ thuật công nghệ
Khoa học tự nhiên
Khoa học xã hội
Văn hóa nghệ thuật
Y tế sức khỏe
Văn bản luật
Nông lâm ngư
Kĩ năng mềm
Luận văn - Báo cáo
Giải trí - Thư giãn
Tài liệu phổ thông
Văn mẫu
Thông tin
Điều khoản sử dụng
Quy định bảo mật
Quy chế hoạt động
Chính sách bản quyền
0
Trang chủ
Công Nghệ Thông Tin
Hệ điều hành
Near duplicate document detection survey
TAILIEUCHUNG - Near duplicate document detection survey
Search engines are the major breakthrough on the web for retrieving the information. But List of retrieved documents contains a high percentage of duplicated and near document result. So there is the need to improve the performance of search results. Some of current search engine use data filtering algorithm which can eliminate duplicate and near duplicate documents to save the users’ time and effort. | ISSN:2249-5789 Bassma S Alsulami et al, International Journal of Computer Science & Communication Networks,Vol 2(2), 147-151 Near Duplicate Document Detection Survey Bassma S. Alsulami, Maysoon F. Abulkhair, Fathy E. Eassa Faculty of Computing and Information Technology King AbdulAziz University Jeddah, Saudi Arabia Abstract—Search engines are the major breakthrough on the web for retrieving the information. But List of retrieved documents contains a high percentage of duplicated and near document result. So there is the need to improve the performance of search results. Some of current search engine use data filtering algorithm which can eliminate duplicate and near duplicate documents to save the users’ time and effort. The identification of similar or near-duplicate pairs in a large collection is a significant problem with wide-spread applications. In this paper survey present an up-to-date review of the existing literature in duplicate and near duplicate detection in Web. Keyword—Duplicate document, near duplicate pages, near duplicate detection, Detection approaches 1. INTRODUCTION Information on the Web is very huge in size. There is a need to use this big volume of information efficiently for effectively satisfying the information need of the user on the Web. Search engines become the major breakthrough on the web for retrieving the information. Where, among users looking for information on the Web, 85% submit information requests to various Internet search engines. Search engines are critically important to help users find relevant information on the Web. Search engines in response to a user's query typically produces the list of documents ranked according to closest to the user's request. These documents are presented to the user for examination and evaluation. Web users have to go through the long list and inspect the titles, and snippets sequentially to recognize the required results. Filtering the search engines' results consumes the users' effort and
Thùy Giang
89
5
pdf
Báo lỗi
Trùng lắp nội dung
Văn hóa đồi trụy
Phản động
Bản quyền
File lỗi
Khác
Upload
Tải xuống
đang nạp các trang xem trước
Bấm vào đây để xem trước nội dung
Tải xuống
TÀI LIỆU LIÊN QUAN
Securing the sip communications with XML security mechanisms in VoIP application awareness
7
102
0
Proposing minimum performance of proposed topology in Plateau State University
6
107
0
Performance evaluation of manet protocols in communications and management of robots in simulation modelling
12
59
0
Deployment of voip communications in B&A spy agency: Design and implementation
8
94
2
A proposed architecture and protocol stack for improving QoS in wide vehicular communications
11
75
0
An enhanced data security with compression for manets
6
71
0
Wireless local area network security enhancement through penetration testing
16
86
0
Increasing the lifetime of wireless sensor networks by selforganizing map algorithm
8
64
0
A cloud computing architecture with wireless sensor networks for agricultural applications
5
71
0
Adaptive scheme for outliers detection in wireless sensor networks
10
77
0
TÀI LIỆU XEM NHIỀU
Một Case Về Hematology (1)
8
462302
61
Giới thiệu :Lập trình mã nguồn mở
14
24977
79
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11294
542
Câu hỏi và đáp án bài tập tình huống Quản trị học
14
10514
466
Phân tích và làm rõ ý kiến sau: “Bài thơ Tự tình II vừa nói lên bi kịch duyên phận vừa cho thấy khát vọng sống, khát vọng hạnh phúc của Hồ Xuân Hương”
3
9797
108
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8878
1161
Tiểu luận: Nội dung tư tưởng Hồ Chí Minh về đạo đức
16
8468
426
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8092
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7481
1764
Đề tài: Dự án kinh doanh thời trang quần áo nữ
17
7196
268
TỪ KHÓA LIÊN QUAN
Hệ điều hành
International Journal of Computer Networks and Communications Security
Near duplicate document detection survey
Near duplicate pages
Near duplicate detection
The major breakthrough
Securing the sip communications with XML security mechanisms
VoIP application awareness
Question of confidentiality and integrity
Client authentication and data confidentiality
Proposing minimum performance of proposed topology
Plateau State University
Computer networks and Communications Security
Performance evaluation of manet protocols in communications
Management of robots in simulation modelling
Manet protocols in communications
End To End Delay
Show network optimization rate including PDR
Deployment of voip communications in B&A spy agency
Design and implementation
Voip communications in B&A spy agency
VoIP simulated in OPNET
Proposed architecture and protocol stack for improving QoS
Wide vehicular communications
Vehicle to Vehicle
An enhanced data security with compression for manets
Enhanced data security
Self organizing networks
Wireless local area network security enhancement through penetration testing
WLANs to achieve
The frame security
The standard network security
Increasing the lifetime of wireless sensor networks
Selforganizing map algorithm
Wireless sensor networks
Self organizing map neural networks
Cloud computing architecture
Wireless sensor networks for agricultural applications
Wireless sensor actor networks
Adaptive scheme for outliers detection in wireless sensor networks
The Quality of Service
Given sensor networks
Infrared sensor and FBUS technology
House security system based on mobile phone
House security system
Secure the place
Potential applications of linear wireless sensor networks
Linear wireless sensor networks
LWSN in various applications
LWSN in network topology
Time dependent finite state machine
Method for intrusion detection in mobile ad hoc networks
Mobile ad hoc networks
Malicious behavior in AODV
Performance analysis of multimedia traffic
MPLS communication networks with traffic engineering
MPLS communication networks
Conventional IP network
Inter cluster communication in wireless sensor networks
Inter cluster communication
Carrying out efficient diffusion
Cluster merging and cluster diffusion
An optimized model for transition from Ipv4 to Ipv6 networks
Cloud computing environment
Ipv4 to Ipv6 networks
Identical traffic and network loads
The optical communications
Simulating an optical high debit transmission chain
Optisystem with comparison of optical windows
Comparison of optical windows
New unicast routing algorithm for load balancing
Multigateway wireless mesh networks
Negative percent algorithms
Wireless mesh networks
Detection of service attack
Defense against distributed denial of service attack
Packet filtration in wireless sensor networks
An advance security technique challenges to government
Wireless sensor network for health
Emphasize ongoing treatment challenges
Wireless sensor network
Medical information systems
The security of information in financial transactions via mobile
Financial transactions via mobile
Implement a particular algorithm
A comprehensive approach to security requirements engineering
Incorporating the strengths
Best practices found
Evaluation of security function of flipora plug in on browsers
Flipora plug in on browsers
Plug in in upon
Flipora plug in
Multi perspective analysis framework
Multi level analysis framework
Network security situational awareness
Multi data analyzing researc
Improving security and performance in the tor network
The tor network
IP hidden in the server
TÀI LIỆU MỚI ĐĂNG
THE ANTHROPOLOGY OF ONLINE COMMUNITIES BY Samuel M.Wilson and Leighton C. Peterson
19
212
4
30-11-2024
Data Structures and Algorithms - Chapter 8: Heaps
41
173
5
30-11-2024
báo cáo hóa học:" Quality of data collection in a large HIV observational clinic database in sub-Saharan Africa: implications for clinical research and audit of care"
7
147
4
30-11-2024
Giáo án điện tử tiểu học môn lịch sử: Cách mạng mùa thu
39
158
1
30-11-2024
Đề tài " Dự báo về tác động của Tổ chức Thương mại Thế giới WTO đối với các doanh nghiệp xuất khẩu vừa và nhỏ Việt Nam – Những giải pháp đề xuất "
72
178
2
30-11-2024
ĐỀ TÀI " ĐÁNH GIÁ HIỆU QUẢ HOẠT ĐỘNG KINH DOANH NGOẠI HỐI CỦA NGÂN HÀNG THƯƠNG MẠI CỔ PHẦN XUẤT NHẬP KHẨU VIỆT NAM "
51
146
3
30-11-2024
Báo cáo nghiên cứu khoa học " NÂNG QUAN HỆ KINH TẾ THƯƠNG MẠI VIỆT NAM - TRUNG QUỐC LÊN TẦM CAO THỜI ĐẠI "
8
160
1
30-11-2024
Determini prounoun 1
6
134
0
30-11-2024
longman english 1
5
123
0
30-11-2024
Sinh thái học nông nghiệp : Sinh thái học và sự phát triển Nông nghiệp part 8
8
130
0
30-11-2024
TÀI LIỆU HOT
Mẫu đơn thông tin ứng viên ngân hàng VIB
8
8092
2279
Giáo trình Tư tưởng Hồ Chí Minh - Mạch Quang Thắng (Dành cho bậc ĐH - Không chuyên ngành Lý luận chính trị)
152
7481
1764
Ebook Chào con ba mẹ đã sẵn sàng
112
4369
1369
Ebook Tuyển tập đề bài và bài văn nghị luận xã hội: Phần 1
62
6162
1259
Ebook Facts and Figures – Basic reading practice: Phần 1 – Đặng Tuấn Anh (Dịch)
249
8878
1161
Giáo trình Văn hóa kinh doanh - PGS.TS. Dương Thị Liễu
561
3797
680
Giáo trình Sinh lí học trẻ em: Phần 1 - TS Lê Thanh Vân
122
3911
609
Giáo trình Pháp luật đại cương: Phần 1 - NXB ĐH Sư Phạm
274
4623
562
Tiểu luận: Tư tưởng Hồ Chí Minh về xây dựng nhà nước trong sạch vững mạnh
13
11294
542
Bài tập nhóm quản lý dự án: Dự án xây dựng quán cafe
35
4460
490
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.