Google сцука опасный 
четверг, 29 ноября 2012, 16:46 - Хайтек
Выложил тут на свой сайт свой pdf-файлик с личной информацией лично для себя и через некоторое время обнаружил, что Гугл проиндексировал его содержимое.

Причём на сайте непосредственной ссылки на файл не было, была ссылка на отдельные файлы, и строился индекс файлов на странице на уровень выше, куда тоже прямых ссылок нет.

Файл понятно затёр и написал запрос в Гугл на удаление из кэша, за сутки удалили (сначала пришлось подтвердить что это мой сайт, добавив специальный файл от гугла в корень сайта).

P.S. Да, я знаю про robots.txt и .htaccess с -Indexes, просто почему то был уверен, что туда не полезет, а про то, что проиндексировало содержимое PDF-файла, вообще был удивлён.

P.P.S. Кстати, проверить что у гугла есть на вас в открытом доступе можно просто введя ФИО и год рождения.

cepn 
вторник, 4 декабря 2012, 16:42
История получила интересное продолжение, насколько я помню на момент первоночальной проверки того документа на Яндексе не было, но через некоторое время он чудесным образом появился :) Видимо они проверяют запросы на гугле и тащат оттуда, как следствие, появился и на рамблере, т.к. те используют движок яндекса, пришлось удалять ещё и с яндекса.

Комментарии 

Добавление комментария

Заполните форму для добавления вашего комментария.









Специальные возможности: