Google индексирует Robots.txt?
16.10.2007 Google
Magnet в комментарии к статье про файлы robots.txt на сайтах из каталога Dmoz спросил, были ли какие-нибудь эксперименты по поводу: индексирует ли Google этот файл, какие инструкции исполняет и какие нет, жрет ли что-нибудь кроме команд (например ключевые слова).
Так вот, Google индексирует robots.txt как полноправный файл (спасибо Сre8asiteforums)
Как мы понимаем, никаких внешних ссылок на файл robots.txt никто не ставит, значит он заносится в индекс на всех сайтах во время обхода роботом.
Какие делаем выводы?
1. Если вам есть что скрывать на вашем сайте и вы не ставите на скрытые файлы/папки никаких ссылок, то не запрещайте их для индексации даже “на всякий случай”. Вот пример:
Robots.txt открыт для всех пользователей, поэтому ваша попытка спрятать секретную папку может обернуться против вас. Возможный вариант решения проблемы - давать доступ к файлу для роботов и запрещать чтение для остальных юзеров, то есть использовать клоакинг. Правда это уже похоже на стрельбу из пушки по воробьям, но мало ли что…
2. Если Google заносит robots.txt в свой индекс наравне с другими текстовыми файлами, то теоретически можно набить robots.txt ключевиками, ждать индексации и потом через .htaccess или другими способами делать редирект куда угодно. На практике правда я такого чуда не встречал. Наравне с веб документами в выдаче пока не применяя специальных операторов можно увидеть только PDF и DOC файлы.
Может быть вы что-нибудь подобное встречали?
Еще почитать:
- Be up to date
- Dmoz: Каждый четвертый сайт имеет ошибки в robots.txt
- Google палит темы
- Как правильно искать в Гугле
- Антиспам: как применить для борьбы с CGI Proxy Hijack
- М.Каттс о nofollow, допустимом количестве ссылок на странице и о каталогах
- Продвинутый клоакинг: как роботы индексируют платный контент
- Язык запросов Google




16.10.2007 в 6:14 pm
Про то, что в robots.txt нельзя вписывать секретные файлы - правда. Интерес к ним наоборот увеличивается и не только со стороны ПС.
Про второй пункт ещё не слышал. Но теоретически думаю возможно.
16.10.2007 в 8:56 pm
Второй вариант немного сумасшедший, но мало ли…
22.05.2008 в 12:20 pm
http://howto.helpero.com/howto/Find-Secret-Sites-And-Articles_134.html