На прошлой неделе в Сети появилась информация о том, что какому-то удачливому молдавскому спамеру удалось “скормить” Google 5 миллиардов бессмысленных страниц. Столь масштабная спам-атака на поисковик привела к техническим сбоям, в итоге в работе Google можно было заметить некоторые странности.
Вообще, как утверждают SEO-специалисты, существует немало способов “заспамить” лидера поискового рынка. Этот случай примечателен своими масштабами - 5 миллиардов страниц, как утверждается в блоге Джона Бэтла, было проиндексировано поисковиком в течение всего трех недель. Количество страниц действительно огромно, ведь два года назад вся база Google насчитывала меньше документов.
Спамер воспользовался особым отношением поисковика к субдоменам. Каждый из них рассматривается Google как отдельный сайт, поэтому для скорейшего индексирования понадобилось лишь создать внушительное количество субдоменов. Они оказались в базе Google намного быстрее, чем обычные страницы одного-единственного сайта.
К чести поисковика, он довольно быстро справился с проблемой, освободившись от “мусора”. Как утверждает в комментариях к скандальному сообщению один из разработчиков Google, речь идет о сбое, в результате которого в выдаче оказалось большое количество субдоменов.
Между тем, можно встретить предположения о связи описанной проблемы с некорректной работой оператора site. Как известно, с помощью этого оператора можно получить представление о количестве страниц того или иного сайта, хранящихся в базе Google. Некоторые пользователи считают, что в последнее время запросы с оператором site выдают нереальные, завышенные цифры.
“Вебпланета” обратилась за комментариями к российским экспертам в области интернет-поиска.
Игорь Гуров, один из авторов рассылки “Продвижение сайтов. Профессиональные советы экспертов”, признает этот случай исключительным по своим масштабам. “Заспамить Google можно, это бесспорно. Для этого даже не обязательно использовать субдомены, хотя с ними, возможно, будет эффективнее и быстрее. Но 5 миллиардов страниц… В первый раз такое встречаю, - заметил он. - Еще несколько месяцев назад многие начали замечать, что Google показывает больше страниц, нежели действительно есть на сайте (даже если это статика), особенно когда речь идет о тысячах и десятках тысяч страниц (Google мог показывать в разы, а то и на порядок большее число по оператору site)”.
Сергей Петренко, руководитель проекта Searchengines.ru и директор компании “Яндекс.Украина”, считает, что масштабы этой спам-атаки могут быть преувеличены: “Исходя из отзывов, которые я видел в обсуждениях этого случая, речь здесь, скорее, о сбое - робот Google запутался в индексируемых данных и при обновлении базы все это попало в основной поиск. Сейчас сложно судить, что именно сделал спамер и как это увидел робот, разумеется. Вряд ли там действительно есть или было 5 миллиардов страниц”.