TAILIEUCHUNG - Sự quan trọng của file Robots.txt

Sự quan trọng của file Một trong những điều quan trọng để web site của bạn có thể đạt High ranking (thứ hạng cao) trong các cỗ máy tìm kiếm là bạn phải xây dựng cho mình một file Vậy file là gì? khi một search engine tìm đến (nguyên văn Crawler) web site nào đó, nó sẽ tìm một file đặc biệt trước tiên, đó là file . File cho search engine đó biết rằng, web site này có thể index hoặc không (tùy theo lệnh được viết trong file ). . | Sự quan trọng của file Một trong những điều quan trọng để web site của bạn có thể đạt High ranking thứ hạng cao trong các cỗ máy tìm kiếm là bạn phải xây dựng cho mình một file Vậy file là gì khi một search engine tìm đến nguyên văn Crawler web site nào đó nó sẽ tìm một file đặc biệt trước tiên đó là file . File cho search engine đó biết rằng web site này có thể index hoặc không tùy theo lệnh được viết trong file . Thực chất file là một tập tin văn bản đơn giản không chứa mã HTML được đặt trong thư mục gốc của web site ví dụ http .com robots .txt. Vậy làm thế nào để tạo ra một file Rất đơn giản bạn có thể mở chương trình Notepad hay bất cứ chương trình soạn thảo văn bản nào lưu file với tên là xong. Các dòng lệnh trong file này có cấu trúc như sau User-agent googlebot Disallow cgi-bin Trong đó User-agent là đại diện của một search engine Googlebot là spider của Google. Trong ví dụ này chỉ các spider của Google là được phép index web site. Disallow là không cho phép thực hiện điều gì đó. ở ví dụ trên là không cho phép các spider index thư mục cgi-bin trong web site. Ví dụ thứ hai User-agent googlebot Disallow support Tất cả các trang nằm trong thư mục support hay support-desk sẽ không được index. Nếu bạn muốn tất cả các search engine có thể index web site của bạn nhưng không được index các trang trong thư mục cgi-bin thì sử dụng lệnh sau User-agent Disallow cgi-bin Những điều nên tránh Không sử dụng các chú thích trong file nó có thể làm cho các spider của search engine bị lầm lẫn. Ví dụ Disallow support Don t index the support directory might be misinterepreted as Disallow support Don t index the support directory . Không được để khoảng trắng ở đầu dòng lệnh ví dụ User-agent

TÀI LIỆU MỚI ĐĂNG
TAILIEUCHUNG - Chia sẻ tài liệu không giới hạn
Địa chỉ : 444 Hoang Hoa Tham, Hanoi, Viet Nam
Website : tailieuchung.com
Email : tailieuchung20@gmail.com
Tailieuchung.com là thư viện tài liệu trực tuyến, nơi chia sẽ trao đổi hàng triệu tài liệu như luận văn đồ án, sách, giáo trình, đề thi.
Chúng tôi không chịu trách nhiệm liên quan đến các vấn đề bản quyền nội dung tài liệu được thành viên tự nguyện đăng tải lên, nếu phát hiện thấy tài liệu xấu hoặc tài liệu có bản quyền xin hãy email cho chúng tôi.
Đã phát hiện trình chặn quảng cáo AdBlock
Trang web này phụ thuộc vào doanh thu từ số lần hiển thị quảng cáo để tồn tại. Vui lòng tắt trình chặn quảng cáo của bạn hoặc tạm dừng tính năng chặn quảng cáo cho trang web này.