Google напомнил о правилах индексации документов после инцидента с "Яндексом"
Накануне вечером в выдаче российского поисковика появились гугл-документы, похожие на персональные данные
Москва. 5 июля. INTERFAX.RU - Корпоративный блог Google опубликовал запись, в которой уточнил правила индексации документов пользователей Google Docs.
Запись появилась после того, как вечером в среду поисковик "Яндекса" начал тщательно индексировать в поиске документы пользователей Google Docs, выдавая по соответствующим запросам файлы, содержащие, например, пароли, фамилии и телефоны, номера кредитных карт, корпоративные документы.
В блоге Google между тем "Яндекс" не упоминается.
В сентябре 2009 года Google сообщила, что публичные документы из Google Docs при наличии публичной ссылки будут появляться в выдаче поисковиков. Таким образом, ссылка на документ, которой пользователь ни с кем не делился, не должна появляться в выдаче. Это должно быть так даже в том случае, если доступ к документу не ограничен.
В своей новой записи американская компания напомнила, что "поисковые системы могут индексировать только те документы, которые намеренно были сделаны их владельцами публичными, или когда кто-либо публикует ссылку на документ, владелец которого сделал его доступным для поиска и просмотра всем в интернете".
У пользователя, как отмечается, имеется возможность выставить настройки приватности, то есть определить, что именно доступно для просмотра, комментирования или редактирования выбранным пользователям.
Российский поисковик вечером 4 июля начал выдавать искомые документы, если ему указывали область поиска docs.google.com, а в строке поиска писали, например, "пароли". В выдаче показывались документы с информацией, похожей на персональные данные, в текстовом формате или формате электронной таблицы
Около часа ночи возможность яндекс-поиска по Google Docs прекратилась.
В "Яндексе" пояснили ранее, что поисковик индексирует лишь открытую часть интернета, то есть те страницы, которые доступны при переходе по ссылкам без ввода логина и пароля. При этом страницы, индексация которых запрещена администратором сайта в файле robots.txt, "Яндекс" не индексирует, даже если они находятся в открытой части интернета.
Robots.txt - файл, хранящийся в корне многих сайтов и регламентирующий работу поисковых роботов. Они получают инструкции о том, какие файлы и пути на сервере им разрешено сканировать.