Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Khóa luận trình bày một số nội dung cơ bản nhất về thư rác (khái niệm, tác hại, các hình thức phát tán thư rác.), tập trung định hướng tới các phương pháp lọc thư rác, đặc biệt là phương pháp lọc dựa trên nội dung. Trong các phương pháp lọc theo nội dung, khóa luận quan tâm mô tả, phân tích hệ thống hệ thống Email Classification Using Examples (ECUE), một phương pháp lọc spam dựa trên nội dung do Delany và Cunningham đề xuất năm 2004 [4]. Khóa luận mô tả kiến trúc của CBR và kiến trúc. | Luận văn tôt nghiệp Phương pháp lọc thư rác dựa trên CBR Tóm tăt nội dung khóa luận Khóa luận trình bày một số nội dung cơ bản nhất về thư rác khái niệm tác hại các hình thức phát tán thư rác. tập trung định hướng tới các phương pháp lọc thư rác đặc biệt là phương pháp lọc dựa trên nội dung. Trong các phương pháp lọc theo nội dung khóa luận quan tâm mô tả phân tích hệ thống hệ thống Email Classification Using Examples ECUE một phương pháp lọc spam dựa trên nội dung do Delany và Cunningham đề xuất năm 2004 4 . Khóa luận mô tả kiến trúc của CBR và kiến trúc hệ thống ECUE. Hệ thống ECUE có khả năng giải quyết được vấn đề concept drift hệ thống được xây dựng dựa trên phương pháp Case-Based Reasoning CBR 1 với việc coi các email là các case tập các case đã được phân lớp spam non-spam được sử dụng làm tập dữ liệu huấn luyện gọi là case-base. Để giải quyết vấn đề concept drift ECUE có hai thành phần chính là Case-base Editing và case-base update policy 5 . Phần cuối cùng của khóa luận trình bày về kết quả thực nghiệm tiến hành trên hệ thống lọc thư rác sử dụng thuật toán Bayes theo chương trình Spambayes. 1 Mở đầu Một trong những dịch vụ mà Internet mang lại đó là dịch vụ thư điện tử đó là phương tiện giao tiếp rất đơn giản tiện lợi rẻ và hiệu quả giữa mọi người trong cộng đồng sử dụng dịch vụ Internet. Tuy nhiên chính vì những lợi ích của dịch vụ thư điện tử mang lại mà số lượng thư trao đổi trên Internet ngày càng tăng và một số không nhỏ trong số đó là thư rác spam . Thư rác thường được gửi với số lượng rất lớn không được người dùng mong đợi thường với mục đích quảng cáo đính kèm virus gây phiền toái khó chịu cho người dùng làm giảm tốc độ truyền internet và tốc độ xử lý của email server gây thiệt hại rất lớn về kinh tế. Đã có rất nhều phương pháp đưa ra để giảm số lượng thư rác. Như việc đưa ra các luật lệ để hạn chế việc gửi thư rác đưa ra các phương pháp kĩ thuật lọc thư rác như lọc dựa trên địa chỉ IP whitelist balacklist lọc dựa trên danh tính người gửi lọc dựa .