Đang chuẩn bị nút TẢI XUỐNG, xin hãy chờ
Tải xuống
Dưới đây là hướng dẫn tạo và sử dụng file robots.txt cho website, để các bộ máy tìm kiếm quản lý index nội dung của website bạn robots.txt là file văn bản có cấu trúc, khi các spider (bot, crawler) của các SE (Search engine) vào website để thu thập dữ liệu thì sẽ vào file robots.txt để xem các chỉ dẫn trong file này. | Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl CTQ Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Hl Dưới đây là hướng dẫn tạo và sử dụng file robots.txt cho website để các bộ máy tìm kiếm quản lý index nội dung của website bạn robots.txt là file văn bản có cấu trúc khi các spider bot crawler của các SE Search engine vào website để thu thập dữ liệu thì sẽ vào file robots.txt để xem các chỉ dẫn trong file này. robots.txt có thể quy định từng loại bot khác nhau của các SE khác nhau có thể vào website hay từng khu vực của website hay không Vài loại bot của các SE Googlebot Google Googlebot-Image Google Yandex SE của Nga Bingbot Bing Yahoo Slurp Yahoo . Những cú pháp thông dụng trong file robots.txt User-agent đối tượng bot được chấp nhận Disallow Allow URL muốn chặn cho phép Đại diện cho tất cả Ví dụ User-agent Có nghĩa là chấp nhận tất cả các loại bot. Khóa toàn bộ site Disallow Chặn 1 thư mục và mọi thứ nằm trong nó Disallow wp-admin Chặn 1 trang Disallow private_file.html Loại bỏ 1 hình từ Google Images User-agent Googlebot-Image Disallow images sexy.jpg Bỏ tất cả các hình từ Google Images User-agent Googlebot-Image Disallow Chặn 1 file hình bất kỳ ví dụ .gif User-agent Googlebot Disallow .gif