TAILIEUCHUNG - LUẬN VĂN: TÌM HIỂU VỀ WEB CRAWLER VÀ XÂY DỰNG WEBSITE TỔNG HỢP THÔNG TIN

Tham khảo luận văn - đề án 'luận văn: tìm hiểu về web crawler và xây dựng website tổng hợp thông tin', luận văn - báo cáo, công nghệ thông tin phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả | DỰNG ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Minh Phúc TÌM HIỂU VỀ WEB CRAWLER VÀ XÂY WEBSITE TỔNG HỢP THÔNG TIN KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành Công nghệ thông tin HÀ NỘI - 2010 Tìm hiểu về web crawler và xây dựng website tổng hợp thông tin 2010 À HtAi A - 1 Ấ Ấ 7 1 V 1 ĩ 1 X HÀ NỌI - 20 hai sô cuôi của năm bảo vệ KLTN chữ hoa 12pt đậm căn giữa LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc của mình đến thầy Hoàng Xuân Huấn thuộc bộ môn Khoa học máy tính khoa Công nghệ thông tin trường Đại học Công Nghệ ĐHQGHN. Trong quá trình thực hiện khóa luận thầy đã nhiệt tình giúp đỡ giải đáp các thắc mắc tạo động lực giúp tôi hoàn thành khóa luận tôt nghiệp này. Tôi cũng xin được bày tỏ lời cảm ơn tới các thầy cô trong bộ môn nói riêng và trong khoa Công nghệ thông tin nói chung đã nhiệt tình giảng dạy để giúp chúng tôi có được như ngày hôm nay. Cuôi cùng là lời cảm ơn tới gia đình bạn bè những người luôn sát cánh bên tôi những lúc khó khăn luôn ủng hộ giúp đỡ để tôi hoàn thành khóa luận này. II Tìm hiểu về web crawler và xây dựng website tổng hợp thông tin 2010 TÓM TẮT NỘI DUNG Do nhu cầu thu thập thông tin của con người ngày càng tăng lượng thông tin trên internet ngày càng phong phú nên vấn đề tổng hợp thông tin ngày càng trở nên bức thiết. Với một lượng dữ liệu lớn việc thu thập bằng tay tốn rất nhiều công sức và không đạt hiệu quả cao chính vì thế cần một công nghệ có thể tổng hợp thông tin một cách tự động và trình thu thập web đã ra đời. Đề tài khóa luận đặt ra vấn đề tìm hiểu về trình thu thập thông tin trên web và bước đầu sẽ xây dựng một ứng dụng có khả năng tổng hợp thông tin tự động từ trang báo điện tử lớn là trang Dân trí http . Ứng dụng được viết bằng ngôn ngữ lập trình PHP tương tác với cơ sở dữ liệu mySQL và được xây dựng dựa trên các tiêu chí tốc độ thu thập nhanh cơ sở dữ liệu gọn nhẹ đảm bảo tính toàn vẹn của tài liệu gốc. .

TÀI LIỆU LIÊN QUAN
TỪ KHÓA LIÊN QUAN
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.