TAILIEUCHUNG - Phân tích tập tin nhật ký sử dụng kỹ thuật khai phá và logic mờ

Bài viết trình bày việc nghiên cứu khái quát một số kỹ thuật khai phá và logic mờ nhằm khai phá theo sử dụng Website dựa trên phân tích tập tin nhật ký - ghi lại hoạt động của người dùng khi tương tác với Website. | Phân tích tập tin nhật ký sử dụng kỹ thuật khai phá và logic mờ Nghiên cứu khoa học công nghệ PHÂN TÍCH TẬP TIN NHẬT KÝ SỬ DỤNG KỸ THUẬT KHAI PHÁ VÀ LOGIC MỜ Nguyễn Văn Quân1*, Hoàng Tuấn Hảo1, Vũ Văn Cảnh1, Hoàng Thế Triều2 Tóm tắt: Cùng với lượng dữ liệu Website ngày càng tăng nhanh trên Internet, trong những năm gần đây lĩnh vực nghiên cứu khai phá dữ liệu Website rất được quan tâm. Trong bài báo này, chúng tôi nghiên cứu khái quát một số kỹ thuật khai phá và logic mờ nhằm khai phá theo sử dụng Website dựa trên phân tích tập tin nhật ký - ghi lại hoạt động của người dùng khi tương tác với Website. Trong quá trình nghiên cứu cũng thực hiện kỹ thuật phân cụm mờ và kết hợp luật mờ nhằm nâng cao hiệu quả kiểm tra tập dữ liệu nhật ký từ máy chủ Webserver. Từ khóa: Khai phá Web, Logic mờ, Tập tin nhật ký, Fuzzy. 1. GIỚI THIỆU Trong những năm gần đây cùng với sự phát triển nhanh chóng của khoa học kỹ thuật là sự bùng nổ về tri thức. Kho dữ liệu, nguồn tri thức của nhân loại cũng trở nên đồ sộ, vấn đề khai thác các nguồn tri thức đó đặt ra thách thức lớn cho ngành công nghệ thông tin của thế giới. Cùng với sự tiến bộ vượt bậc của ngành công nghệ thông tin và sự phát triển mạnh mẽ của mạng thông tin toàn cầu, nguồn dữ liệu Web đã trở thành kho dữ liệu khổng lồ. Số lượng Website tăng mạnh, dữ liệu Website vô cùng lớn đòi hỏi phát triển nhiều kỹ thuật quản lý, lưu trữ và khám phá tri thức trên cơ sở dữ liệu lớn – Knowledge Discovery in Database (KDD). Giai đoạn chính của KDD là quá trình khai phá dữ liệu, thông qua kỹ thuật khám phá thì tri thức có thể được tìm thấy trong dữ liệu, và nó thường được lưu trữ trong cơ sở dữ liệu quan hệ theo một dạng cấu trúc [1]. Các lĩnh vực nghiên cứu khác cũng phát triển liên quan tới Web và khai thác thông tin tài liệu trong cơ quan và tổ chức. Công nghệ Web thay đổi, phát triển nhanh chóng và ngày càng được mở rộng không đơn thuần chỉ để tìm kiếm và truy vết thông tin mà còn để thiết

TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.