TAILIEUCHUNG - Đánh giá một số kĩ thuật phát hiện thư rác ứng dụng thuật toán xếp hạng người dùng trong mạng thư điện tử tại trường Đại học Hà Nội

Bài báo phân tích và kiểm nghiệm bốn phương pháp lọc thư rác dựa trên việc xếp hạng người dùng trong mạng thư điện tử: Phương pháp độ phân cụm, phương pháp độ phân cụm mở rộng, phương pháp sử dụng thuật toán PageRank và phương pháp sử dụng thuật toán PageRank có trọng số. | Journal of Computer Science and Cybernetics, , (2014), 203–215 DOI: ĐÁNH GIÁ MỘT SỐ KĨ THUẬT PHÁT HIỆN THƯ RÁC ỨNG DỤNG THUẬT TOÁN XẾP HẠNG NGƯỜI DÙNG TRONG MẠNG THƯ ĐIỆN TỬ TẠI TRƯỜNG ĐẠI HỌC HÀ NỘI TRẦN QUANG ANH, VŨ MINH TUẤN, HÀ QUANG MINH Khoa Công nghệ thông tin, Trường Đại học Hà Nội anhtq@; minhtuan_fit@; minhhq_fit@ Tóm tắt. Bài báo phân tích và kiểm nghiệm bốn phương pháp lọc thư rác dựa trên việc xếp hạng người dùng trong mạng thư điện tử: Phương pháp độ phân cụm, phương pháp độ phân cụm mở rộng, phương pháp sử dụng thuật toán PageRank và phương pháp sử dụng thuật toán PageRank có trọng số. Các thí nghiệm được thực hiện trên một số tập dữ liệu hoàn chỉnh của mạng thư điện tử Đại học Hà Nội. So sánh kết quả các thí nghiệm cho thấy, phương pháp sử dụng thuật toán PageRank và phương pháp độ phân cụm mở rộng mở rộng có kết quả tốt hơn các phương pháp còn lại. Tỷ lệ phát hiện thành công thư rác lên tới trên 99,5% trong khi tỷ lệ báo động nhầm thấp hơn 0,5%. Từ khóa. phát hiện thư rác; mạng thư điện tử, phân cụm, thuật toán PageRank, xếp hạng người dùng. Abstract. In this paper, four spam-filtering approaches based on user’s ranking in the mail networks: Clustering, Extended Clustering Coefficient, PageRank Algorithm and Weighted PageRank Algorithm are analyzed. We also propose a couple of fully worked-out datasets from the email network of Hanoi University against which the experimental comparisons with the respect to the accuracy of email user ranking and spam filtering are conducted. The results indicate that PageRank algorithm and Extended Clustering Coefficient approaches are better than others. The rate of true detection is over while the failed alarm remains below . Keywords. spam detection, email network, clustering, PageRank algorithm, user ranking. 1. MỞ ĐẦU Trong những năm gần đây, ngăn chặn thư rác đã trở thành sứ mệnh toàn cầu trong lĩnh vực an ninh mạng. Các .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.