Как поисковые системы находят спам. Поисковый спам: что это, основные виды и способы выявления

Продвижение web-сайта в поисковых системах является задачей №1 для любого вебмастера и оптимизатора. Ведь именно от высоких позиций по запросам зависит количество посетителей сайта и, в конечном итоге, приносимая этим сайтом прибыль. Добиваться хороших позиций в поиске можно разрешёнными, либо неразрешёными методами, к последним относится поисковый спам, или как его называют в компании Google — «webspam» .

Если открыть «Лицензию на использование поисковой системы Яндекс», то пункт 3.7. этой лицензии выводит определение поискового спама так: «Поисковый спам» - это попытки обмана поисковой системы Сервиса и манипулирования ее результатами с целью изменения позиции того или иного веб-сайта в результатах поиска. Веб-сайты, использующие «поисковый спам», могут быть понижены при ранжировании или исключены из базы Сервиса из-за невозможности их корректного ранжирования. — Таким образом Яндекс регламентирует вебспам как обман ПС и манипулирование результатами поиска, не говоря конкретно какие именно манипуляции имеются в виду.

Корпорация Гугл имеет в своём составе всем известный отдел Webspam Team , которым командует всем известный Мэтт Кац и занимается этот отдел как раз борьбой с поисковым спамом. Одно из последних детищ данного отдела — фильтр Google Penguin , наделавший много шума с весны 2012 года.

Google относит к вебспаму, кроме прочего, следующие вещи:

  • Дорвеи
  • Скрытый текст и скрытые ссылки
  • Схемы обмена ссылками
  • Маскировка и скрытый редирект
  • Страницы, наполненные нерелевантными ключевыми словами
  • Страницы или домены с почти одинаковым содержанием
  • Схемы обмена ссылками

За всё это сайт могут понизить в ранжировании а то и выкинуть из поисковых баз. Докладывать о сайтах, применяющих незаконные методы поискового спама Google рекомендует через эту страницу . Не исключено, что таким образом кто-то избавляется от конкурентов в поисковой выдаче.

Из сказанного выше можно понять, что вебспам — это манипулирование контентом и ссылками с целью получения высоких позиций. Способов вебспама как таковых существует очень много и смысла перечислять все их в данной статье нет.

Коэффициент спамности

При ранжировании сайтов используется такой показатель, как коэффициент спамности отдельной веб-страницы и целого веб-сайта. Этот коффициент постоянно пересчитывается в зависимости от входящих данных и влияет на ранжирование в совокупности с другими факторами.

Ссылочный поисковый спам

К ссылочному вебспаму чаще всего относят:

  • Создание сайтов (сеток сайтов) специально под ссылки
  • Ссылочный обмен
  • Мусорные ссылки из комментариев
  • Немодерируемые линки
  • Ссылки скрытые
  • Ссылки сквозные не имеющие отношения к тематике сайта
  • Покупные ссылки с вхождением ключа
  • Ссылки для манипулирования PR и ТИЦ

Текстовый поисковый спам

Текстовый поисковый спам чаще всего сводится к переспаму ключевыми словами

  • текста страницы
  • заголовков
  • метатегов
  • ссылок
  • наличию кс в домене
  • и т.д.

В заключение стоит сказать, что поисковые системы всегда были настроены на борьбу с поисковым спамом и эта борьба продолжается до сих пор. Причём успехи поисковиков в этом деле видны невооруженным глазом. А вот какие методы продвижения выбрать для своих сайтов, решать только вам.

Рэнд Фишкин об анкорах и будущем ссылок

Спам в SEO

Поисковые системы, как известно, не любят всяческие попытки повлиять на их алгоритмы. В то же время, например, сам Яндекс в своём руководстве для вебмастеров описывает способы, улучшающие ранжирование сайта. Про эти способы нельзя сказать, что они приводят к манипуляции с выдачей. Но если каждый из них несколько усилить, то произойдёт т.н. поисковый спам , или спамдексинг .

В я уже упомянул некоторые «тёмные» моменты поисковой оптимизации, приводящие сначала к взлёту сайта, а после — к резкому его падению или вообще исчезновению.

С поисковым спамом — примерно то же самое, но его нельзя отнести конкретно к чёрному SEO, т.к. некоторые его методы приводят лишь к пессимизации (ухудшению ранжирования) сайта и , а не к полной его смерти. Кроме того, многие веб-мастера и т.н. сеошники использует спамдексинг неосознанно (то ли от недостатка опыта, то ли от его переизбытка).

Спам в Интернет

Стоит, наверное, немного раскрыть понятие спама вообще. Изначально английское слово « » означало получение нежелательных писем к себе на электронную почту. Как правило, содержание таких писем носит коммерческий характер с предложением вступить в какую-нибудь компанию. Или классический пример — «Дайте нам свои персональные данные, что бы мы смогли вам прислать $1000000»

Ну а со временем, все нежелательные и неестественные сообщения (например, в сообществах соц.сетей и на форумах) стали относить к спаму. Иными словами, это сообщения с желанием обмануть и получить выгоду.

Что такое поисковый спам

Логично, что спамдексинг — попытки обмана поисковиков. В лицензии на использование поисковой системы Яндекса написано:

Определение Яндекса для спама

К подобным методам можно отнести как очень жёсткие, из области чёрного SEO — создание дорвеев, клоакинг, сокрытие текста , так и методы помягче:

  • Включение в мета-теги keywords и description огромного числа ключевых слов и, или слов, вообще не относящихся к содержанию страницы (но очень популярных по поисковым запросам). Потому, кстати, и утратил своё значение. Возможно, в настоящее время кривое использование Keywords не приведёт к негативным последствиям для сайта, но надо быть поаккуратнее.
  • Перенасыщение текстов статей . Это явно намекает поисковым системам о наличии поискового спама.
  • То же, что и в предыдущем пункте + «запихивание» всех этих слов и фраз в теги акцентирования (жирный, курсив). Прямо говорит поисковикам о спамдексинге.
  • Ссылочный спам . Здесь всё просто и понятно — получение неестественных ссылок на свой ресурс. Хорошая ссылка, с точки зрения поисковой системы, должна быть рекомендацией посетить тот или иной сайт . А если этот сайт сам пытается получить для себя , да ещё и не всегда «красивыми» способами, то он спамит. Конечно, практические невозможно протолкнуть в ТОП (можно, но долго) без внешних ссылок, поэтому внешние ссылки надо получать с умом.
  • Новое веяние в поисковом спаме — воздействие . Осуществляется несколькими способами: 1) Использование программ, эмулирующих поведение пользователей в поисковой выдаче 2) Привлечение пользователей, чтобы они за вознаграждение изобразили заинтересованность в каком-нибудь сайте, для .

С каждым годом число сайтов, размещаемых в интернете, увеличивается в геометрической прогрессии. В результате сильно повышается конкуренция за место в ТОПе (особенно по высокочастотным запросам).

Вебмастера и оптимизаторы вынуждены использовать самые разные методы с целью продвижения собственных сайтов (своих ресурсов) в условиях постоянно возрастающей конкуренции.

И некоторые из этих методов частично или полностью запрещены поисковыми системами.

Многие пользователи не понаслышке знают про спам в своей , но про поисковый спам знают далеко не все.

Поисковый спам – что это?

Общепринятое название запрещенных способов оптимизации, которые иногда используют некоторые вебмастера, - это поисковый спам.

Данное название обусловлено тем, что поисковая выдача заспамливается страницами с нерелевантным содержимым из-за использования нечестных способов продвижения. Другими словами,

поисковый спам - это когда по запросу пользователя выдается контент, который не соответствует этому запросу (по мнению пользователя) и который не должен находиться в ТОПе (по мнению поисковика).

Наличие таких спам-страниц в поисковой выдаче отрицательно сказывается на отношении людей к поисковым системам, снижает степень их доверия.

Виды поискового спама

Что подпадает под поисковый спам? Перечислим его основные виды.

  1. Набивка контента ключевыми словами и фразами

Ключами «под завязку» может заполняться (набиваться) сам текст, а также описания к картинкам и видеофайлам, мета-теги и т.д.

Все это делается в надежде на то, что алгоритм поисковиков посчитает страницу более релевантной данным ключам. На самом же деле этот способ SEO-оптимизации уже давно не работает. Вебмастера, использующие его, с большЕй вероятностью получат бан для своего сайта, чем прирост его позиций в выдаче.

  1. Автоматический редирект

Это моментальное перенаправление пользователей с одной страницы на другую.

В данном случае при заходе на страницу какого-либо сайта человек мгновенно перенаправляется на другой сайт.

Зачастую пользователь даже не успевает заметить самого редиректа (так как он происходит автоматически и очень быстро). Чаще всего после редиректа человек оказывается на странице рекламного содержания, которая заспамлена ссылками.

  1. Клоаки

В данном случае для каждой из продвигаемых страниц вебмастер создает сразу две версии.

  • Первая версия страницы предназначается для поисковых систем,
  • вторая версия – для обычных пользователей.

Таким образом, клоаки - это разный контент для поисковых систем и для пользователей.

Специальный механизм отслеживает, кто именно заходит на сайт - робот поисковой системы или обычный человек. Исходя из этого, выдается та или иная версия страницы.

Страница для поисковиков очень тщательно оптимизируется, на ней отсутствуют все лишние элементы и детали, но есть масса ключевых слов для поисковых машин. Страница для простых посетителей делается нормальной, максимально удобной и красивой (с точки зрения дизайна и внешнего вида).

И вроде бы «волки сыты, и овцы целы», то есть, поисковики довольны, и пользователи в счастье. Но на самом деле, используя клоаки, вебмастер обманывает поисковик, который в свою очередь такие вещи не прощает и банит «раздваивающиеся» страницы.

  1. Свопинг

Под данным термином подразумевают полную замену содержимого страницы сайта сразу после ее успешной индексации в поисковых системах. Первоочередная задача вебмастера или оптимизатора, использующего свопинг, - наполнить страницу уникальным и качественным контентом, продвинуть ее в выдаче и получить хороший трафик с поисковых систем.

Затем после очередного апдейта (периодического обновления поисковой системы) вебмастер полностью меняет содержимое своей страницы. Вместо уникального контента там появляется текст, напичканный ключами и ссылками на продвигаемые ресурсы (сайты).

Понятно, что при следующем апдейте поисковики обнаружат подмену и пессимизируют страницу. Но до тех пор она будет продолжать собирать трафик (посетителей), какое-то время находясь в ТОПе.

  1. Невидимый текст и ссылки
  • можно использовать очень мелкие шрифты,
  • можно делать одинаковыми цвет шрифта и цвет фона страницы (например, текст белого цвета на белом фоне),
  • можно использовать специальные правила стилей CSS для маскировки ссылок.
  • Можно вставлять в страницу однопиксельные изображения, содержащие ссылку и т.д.

Как с поисковым спамом борются поисковики

Поисковики не любят поисковый спам не только за обман, но, в основном, за то, что поисковый спам вводит пользователя в заблуждение, пользователь остается недоволен и поэтому уходит (может уйти) искать информацию по своему запросу к другому поисковику. Поисковики борются за своих пользователей, поэтому стараются не разочаровывать его и в ответ на его запросы выдать только качественную информацию.

Такой подход подразумевает непримиримую борьбу поисковиков с поисковым спамом. Поисковики стараются найти спам, удалить его из своей базы и наказать (забанить) такой сайт или страницу.

Что касается способов выявления поискового спама, то их всего три.

1) Автоматический

В данном случае выявление поискового спама осуществляется посредством алгоритмов поисковых систем. Исходя из признаков того или иного вида спама, происходит поиск сайтов, на которых используются нечестные способы продвижения, и их последующая пессимизация.

2) Полуавтоматический

В данном случае задача поисковых алгоритмов – поиск подозрительных сайтов и страниц. Конечное решение о бане или о пессимизации сайта принимает модератор () поисковой системы.

3) Ручной

Здесь проверка сайта на предмет причастности к использованию поискового спама от начала и до конца осуществляется модератором (асессором). Чаще всего такие проверки происходят на основании жалоб, поступающих от владельцев сайтов-конкурентов.

В конечном счёте, для обмана пользователя.

Основные виды

  • Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в тегах «meta keywords», «description», например «sex », «халява ». В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта.
  • «Накачка» текста ключевыми словами - искусственное повышение частоты ключевого слова или выражения в тексте и (или) использование элементов разметки HTML (h1-3, strong, b, em, i) для искусственного повышения веса ключевого слова.
  • «Невидимый текст» - текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 пиксель , блоки текста, со стилем «display:none».
  • Ссылочный спам - ссылки, «накручивающие» параметр «link popularity» и PageRank сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок:
    1. Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной.
    2. Принять участие в обмене ссылками.
    3. Приобретать ссылки за деньги.
    4. Ссылочный спам с гостевых книг, блогов, вики и пр.

Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании.

  • Дорвеи - промежуточные страницы, созданные для накрутки веса страницы при ссылочном ранжировании или для организации Гугл-бомбы . В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной может быть неограниченное число дорвеев. Поисковые машины в ответ удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку «Вход на сайт» или что-то подобное.
  • Маскировка , или «клоакинг» - анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь.

Последствия использования поискового спама

  • Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то, в связи с активным использованием этих методов для «обмана» поисковых систем, более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что сделало затруднительным поиск «добропорядочных» страниц c редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми «Средние века, поэзия, Восточная Европа», не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова «Средние века, поэзия», вряд ли будет найдена по этим ключевым словам.

Бытует легенда, что поисковый спам в малых дозах может эффективно положительно сказаться на продвижении сайта. Однако всё, что называется спамом, не может нести пользу потребителям, а поисковый спам относится к разряду серого SEO.

Поисковики умеют распознавать SEO спам. В этой статье мы расскажем вам о том, что такое поисковый спам, чтобы вы случайно не создали его на своём сайте.

Виды поискового спама

Поисковый спам можно разделить на четыре вида:

  • В тексте статьи.
  • В мета-тегах.
  • В ссылках.
  • В доменном имени (да-да, даже такое бывает).

Все эти виды спама могут быть распознаны поисковыми машинами, и при обнаружении их на сайте, он будет понижен в поисковой выдаче. Поэтому поисковый спам следует исключать. Рассмотрим всё по порядку.

Спам в тексте

Поисковый спам в тексте статьи в филологии называется тавтология. Говоря простыми словами – это повторение одних и тех же фраз (слов) до такой степени, что читать становится неудобно, тошно. Отсюда и появился термин « », который обозначает то же самое.

Спам в тексте можно выразить следующим:

«Мы фирма, которая продаёт шампуни, и у нас можно купить шампуни. Мы продаём шампуни дёшево, делаем доставку купленных шампуней. И ещё вы можете купить у нас шампунь».

Спам в тексте появляется оттого, что автор статьи стремится вписать в него слишком много ключевых запросов в надежде, что это положительно сыграет на ранжировании сайта. Однако результат от этого будет только отрицательный. При написании статьи стремитесь к тому, чтобы её было удобно читать.

Спам в метатегах

Спам в метатегах – это та же самая тавтология, только не в статье, а в мета, то есть в описании и заголовке статьи. Если использовать чрезмерно много ключевых запросов в этих частях страницы, то можно получить негативный результат.

Если учесть, какое влияние мета-тегов на продвижение сайта, то можно понять, что спам в них приведёт к ещё большему негативу, чем в тексте статьи.

Ссылочный спам

Внутренняя перелинковка – это хороший способ для ускорения индексации сайта. Однако если с ним переборщить, то эффект будет отрицательный. Так, если вы создадите, например, десяток ссылок на статьяю с анкором «моя статья», то цена такой перелинковке будет нулевая, и это плохо скажется на продвижении.

Спам доменного имени

Некоторые умудряются купить себе такой домен, в котором использован ключевой запрос. Например, купитьшампуньнедорого.рф или kupitshampun.ru. Это и называется поисковый спам доменного имени. И этого тоже желательно избегать.