TAILIEUCHUNG - LUẬN VĂN:XÂY DỰNG ỨNG DỤNG THU THẬP DỮ LIỆU WEB ĐỘNG

Xem xét mô hình tổng quát của một website cung cấp danh bạ về các doanh nghiệp trong nhiều lĩnh vực. Danh bạ này có thể được chia làm nhiều mục lớn (category) về các lĩnh vực lớn, trong mỗi category lại phân ra làm nhiều phân mục nhỏ (sub-category) về các lĩnh vực nhỏ, trong mỗi sub category lại phân ra làm nhiều phân mục nhỏ hơn nữa, cứ thế cho đến phân mục nhỏ nhất, phân mục nhỏ nhất sẽ chứa danh sách các liên kết đến các trang chi tiết về một doanh nghiệp nào đó nằm trong phân mục này | I I 1 1 I 1 1 I I é I i I I I I B BÁO CÁO TÔT NGHIỆP XÂY DỰNG ỨNG DỤNG THU THẬP DỮ LIỆU WEB ĐỘNG ffi I I I I 1 I ffl i I B I I I ffi I I i 1 I B B ỊẸỊj ElfrglỊGUralEinẽl EJlralEĨIrã Eil a Luận văn tốt nghiệp Xây dựng ứng dụng thu thập dữ liệu web tự động MỤC LỤC 4 Phân Quá trình thu thập dữ liệu tổng Phân loại các trang Web dựa vào cách thức chuyển Các khả năng ứng dụng cần cung 5 Thiết Sơ đồ Use Kiến trúc tổng Thành phần Mô hình Bot Các trạng thái của Các lệnh tạo mới xóa sửa thông tin Thành phần Extractor. 23 Các 6 Hiện Môi trường phát triển ứng Giao diện sử dụng của Đặc tả dữ liệu đầu vào bằng XML FOXROCK .30 Cấu trúc tổng quát của file cấu hình Chi tiết các thành phần element .30 Các 2 Luận văn tốt nghiệp Xây dựng ứng dụng thu thập dữ liệu web tự động Cấu trúc Bot Quản lý tiến trình của Robot Robot process .36 Thực hiện quy trình thu thập dữ Simple Crawler .40 Advanced Crawler .42 Ví Extractor. 44 Expression Extractor . 45 XPath Extractor. 45 Selector Extractor. 46

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.