Как поисковые системы находят спам. Поисковый спам: что это, основные виды и способы выявления
Продвижение web-сайта в поисковых системах является задачей №1 для любого вебмастера и оптимизатора. Ведь именно от высоких позиций по запросам зависит количество посетителей сайта и, в конечном итоге, приносимая этим сайтом прибыль. Добиваться хороших позиций в поиске можно разрешёнными, либо неразрешёными методами, к последним относится поисковый спам, или как его называют в компании Google — «webspam» .
Если открыть «Лицензию на использование поисковой системы Яндекс», то пункт 3.7. этой лицензии выводит определение поискового спама так: «Поисковый спам» - это попытки обмана поисковой системы Сервиса и манипулирования ее результатами с целью изменения позиции того или иного веб-сайта в результатах поиска. Веб-сайты, использующие «поисковый спам», могут быть понижены при ранжировании или исключены из базы Сервиса из-за невозможности их корректного ранжирования. — Таким образом Яндекс регламентирует вебспам как обман ПС и манипулирование результатами поиска, не говоря конкретно какие именно манипуляции имеются в виду.
Корпорация Гугл имеет в своём составе всем известный отдел Webspam Team , которым командует всем известный Мэтт Кац и занимается этот отдел как раз борьбой с поисковым спамом. Одно из последних детищ данного отдела — фильтр Google Penguin , наделавший много шума с весны 2012 года.
Google относит к вебспаму, кроме прочего, следующие вещи:
- Дорвеи
- Скрытый текст и скрытые ссылки
- Схемы обмена ссылками
- Маскировка и скрытый редирект
- Страницы, наполненные нерелевантными ключевыми словами
- Страницы или домены с почти одинаковым содержанием
- Схемы обмена ссылками
За всё это сайт могут понизить в ранжировании а то и выкинуть из поисковых баз. Докладывать о сайтах, применяющих незаконные методы поискового спама Google рекомендует через эту страницу . Не исключено, что таким образом кто-то избавляется от конкурентов в поисковой выдаче.
Из сказанного выше можно понять, что вебспам — это манипулирование контентом и ссылками с целью получения высоких позиций. Способов вебспама как таковых существует очень много и смысла перечислять все их в данной статье нет.
Коэффициент спамности
При ранжировании сайтов используется такой показатель, как коэффициент спамности отдельной веб-страницы и целого веб-сайта. Этот коффициент постоянно пересчитывается в зависимости от входящих данных и влияет на ранжирование в совокупности с другими факторами.
Ссылочный поисковый спам
К ссылочному вебспаму чаще всего относят:
- Создание сайтов (сеток сайтов) специально под ссылки
- Ссылочный обмен
- Мусорные ссылки из комментариев
- Немодерируемые линки
- Ссылки скрытые
- Ссылки сквозные не имеющие отношения к тематике сайта
- Покупные ссылки с вхождением ключа
- Ссылки для манипулирования PR и ТИЦ
Текстовый поисковый спам
Текстовый поисковый спам чаще всего сводится к переспаму ключевыми словами
- текста страницы
- заголовков
- метатегов
- ссылок
- наличию кс в домене
- и т.д.
В заключение стоит сказать, что поисковые системы всегда были настроены на борьбу с поисковым спамом и эта борьба продолжается до сих пор. Причём успехи поисковиков в этом деле видны невооруженным глазом. А вот какие методы продвижения выбрать для своих сайтов, решать только вам.
Рэнд Фишкин об анкорах и будущем ссылок
Спам в SEO
Поисковые системы, как известно, не любят всяческие попытки повлиять на их алгоритмы. В то же время, например, сам Яндекс в своём руководстве для вебмастеров описывает способы, улучшающие ранжирование сайта. Про эти способы нельзя сказать, что они приводят к манипуляции с выдачей. Но если каждый из них несколько усилить, то произойдёт т.н. поисковый спам , или спамдексинг .
В я уже упомянул некоторые «тёмные» моменты поисковой оптимизации, приводящие сначала к взлёту сайта, а после — к резкому его падению или вообще исчезновению.
С поисковым спамом — примерно то же самое, но его нельзя отнести конкретно к чёрному SEO, т.к. некоторые его методы приводят лишь к пессимизации (ухудшению ранжирования) сайта и , а не к полной его смерти. Кроме того, многие веб-мастера и т.н. сеошники использует спамдексинг неосознанно (то ли от недостатка опыта, то ли от его переизбытка).
Спам в Интернет
Стоит, наверное, немного раскрыть понятие спама вообще. Изначально английское слово « » означало получение нежелательных писем к себе на электронную почту. Как правило, содержание таких писем носит коммерческий характер с предложением вступить в какую-нибудь компанию. Или классический пример — «Дайте нам свои персональные данные, что бы мы смогли вам прислать $1000000»
Ну а со временем, все нежелательные и неестественные сообщения (например, в сообществах соц.сетей и на форумах) стали относить к спаму. Иными словами, это сообщения с желанием обмануть и получить выгоду.
Что такое поисковый спам
Логично, что спамдексинг — попытки обмана поисковиков. В лицензии на использование поисковой системы Яндекса написано:
Определение Яндекса для спама
К подобным методам можно отнести как очень жёсткие, из области чёрного SEO — создание дорвеев, клоакинг, сокрытие текста , так и методы помягче:
- Включение в мета-теги keywords и description огромного числа ключевых слов и, или слов, вообще не относящихся к содержанию страницы (но очень популярных по поисковым запросам). Потому, кстати, и утратил своё значение. Возможно, в настоящее время кривое использование Keywords не приведёт к негативным последствиям для сайта, но надо быть поаккуратнее.
- Перенасыщение текстов статей . Это явно намекает поисковым системам о наличии поискового спама.
- То же, что и в предыдущем пункте + «запихивание» всех этих слов и фраз в теги акцентирования (жирный, курсив). Прямо говорит поисковикам о спамдексинге.
- Ссылочный спам . Здесь всё просто и понятно — получение неестественных ссылок на свой ресурс. Хорошая ссылка, с точки зрения поисковой системы, должна быть рекомендацией посетить тот или иной сайт . А если этот сайт сам пытается получить для себя , да ещё и не всегда «красивыми» способами, то он спамит. Конечно, практические невозможно протолкнуть в ТОП (можно, но долго) без внешних ссылок, поэтому внешние ссылки надо получать с умом.
- Новое веяние в поисковом спаме — воздействие . Осуществляется несколькими способами: 1) Использование программ, эмулирующих поведение пользователей в поисковой выдаче 2) Привлечение пользователей, чтобы они за вознаграждение изобразили заинтересованность в каком-нибудь сайте, для .
С каждым годом число сайтов, размещаемых в интернете, увеличивается в геометрической прогрессии. В результате сильно повышается конкуренция за место в ТОПе (особенно по высокочастотным запросам).
Вебмастера и оптимизаторы вынуждены использовать самые разные методы с целью продвижения собственных сайтов (своих ресурсов) в условиях постоянно возрастающей конкуренции.
И некоторые из этих методов частично или полностью запрещены поисковыми системами.
Многие пользователи не понаслышке знают про спам в своей , но про поисковый спам знают далеко не все.
Поисковый спам – что это?
Общепринятое название запрещенных способов оптимизации, которые иногда используют некоторые вебмастера, - это поисковый спам.
Данное название обусловлено тем, что поисковая выдача заспамливается страницами с нерелевантным содержимым из-за использования нечестных способов продвижения. Другими словами,
поисковый спам - это когда по запросу пользователя выдается контент, который не соответствует этому запросу (по мнению пользователя) и который не должен находиться в ТОПе (по мнению поисковика).
Наличие таких спам-страниц в поисковой выдаче отрицательно сказывается на отношении людей к поисковым системам, снижает степень их доверия.
Виды поискового спама
Что подпадает под поисковый спам? Перечислим его основные виды.
- Набивка контента ключевыми словами и фразами
Ключами «под завязку» может заполняться (набиваться) сам текст, а также описания к картинкам и видеофайлам, мета-теги и т.д.
Все это делается в надежде на то, что алгоритм поисковиков посчитает страницу более релевантной данным ключам. На самом же деле этот способ SEO-оптимизации уже давно не работает. Вебмастера, использующие его, с большЕй вероятностью получат бан для своего сайта, чем прирост его позиций в выдаче.
- Автоматический редирект
Это моментальное перенаправление пользователей с одной страницы на другую.
В данном случае при заходе на страницу какого-либо сайта человек мгновенно перенаправляется на другой сайт.
Зачастую пользователь даже не успевает заметить самого редиректа (так как он происходит автоматически и очень быстро). Чаще всего после редиректа человек оказывается на странице рекламного содержания, которая заспамлена ссылками.
- Клоаки
В данном случае для каждой из продвигаемых страниц вебмастер создает сразу две версии.
- Первая версия страницы предназначается для поисковых систем,
- вторая версия – для обычных пользователей.
Таким образом, клоаки - это разный контент для поисковых систем и для пользователей.
Специальный механизм отслеживает, кто именно заходит на сайт - робот поисковой системы или обычный человек. Исходя из этого, выдается та или иная версия страницы.
Страница для поисковиков очень тщательно оптимизируется, на ней отсутствуют все лишние элементы и детали, но есть масса ключевых слов для поисковых машин. Страница для простых посетителей делается нормальной, максимально удобной и красивой (с точки зрения дизайна и внешнего вида).
И вроде бы «волки сыты, и овцы целы», то есть, поисковики довольны, и пользователи в счастье. Но на самом деле, используя клоаки, вебмастер обманывает поисковик, который в свою очередь такие вещи не прощает и банит «раздваивающиеся» страницы.
- Свопинг
Под данным термином подразумевают полную замену содержимого страницы сайта сразу после ее успешной индексации в поисковых системах. Первоочередная задача вебмастера или оптимизатора, использующего свопинг, - наполнить страницу уникальным и качественным контентом, продвинуть ее в выдаче и получить хороший трафик с поисковых систем.
Затем после очередного апдейта (периодического обновления поисковой системы) вебмастер полностью меняет содержимое своей страницы. Вместо уникального контента там появляется текст, напичканный ключами и ссылками на продвигаемые ресурсы (сайты).
Понятно, что при следующем апдейте поисковики обнаружат подмену и пессимизируют страницу. Но до тех пор она будет продолжать собирать трафик (посетителей), какое-то время находясь в ТОПе.
- Невидимый текст и ссылки
- можно использовать очень мелкие шрифты,
- можно делать одинаковыми цвет шрифта и цвет фона страницы (например, текст белого цвета на белом фоне),
- можно использовать специальные правила стилей CSS для маскировки ссылок.
- Можно вставлять в страницу однопиксельные изображения, содержащие ссылку и т.д.
Как с поисковым спамом борются поисковики
Поисковики не любят поисковый спам не только за обман, но, в основном, за то, что поисковый спам вводит пользователя в заблуждение, пользователь остается недоволен и поэтому уходит (может уйти) искать информацию по своему запросу к другому поисковику. Поисковики борются за своих пользователей, поэтому стараются не разочаровывать его и в ответ на его запросы выдать только качественную информацию.
Такой подход подразумевает непримиримую борьбу поисковиков с поисковым спамом. Поисковики стараются найти спам, удалить его из своей базы и наказать (забанить) такой сайт или страницу.
Что касается способов выявления поискового спама, то их всего три.
1) Автоматический
В данном случае выявление поискового спама осуществляется посредством алгоритмов поисковых систем. Исходя из признаков того или иного вида спама, происходит поиск сайтов, на которых используются нечестные способы продвижения, и их последующая пессимизация.
2) Полуавтоматический
В данном случае задача поисковых алгоритмов – поиск подозрительных сайтов и страниц. Конечное решение о бане или о пессимизации сайта принимает модератор () поисковой системы.
3) Ручной
Здесь проверка сайта на предмет причастности к использованию поискового спама от начала и до конца осуществляется модератором (асессором). Чаще всего такие проверки происходят на основании жалоб, поступающих от владельцев сайтов-конкурентов.
В конечном счёте, для обмана пользователя.
Основные виды
- Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в тегах «meta keywords», «description», например «sex », «халява ». В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта.
- «Накачка» текста ключевыми словами - искусственное повышение частоты ключевого слова или выражения в тексте и (или) использование элементов разметки HTML (h1-3, strong, b, em, i) для искусственного повышения веса ключевого слова.
- «Невидимый текст» - текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 пиксель , блоки текста, со стилем «display:none».
- Ссылочный спам - ссылки, «накручивающие» параметр «link popularity» и PageRank сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок:
- Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной.
- Принять участие в обмене ссылками.
- Приобретать ссылки за деньги.
- Ссылочный спам с гостевых книг, блогов, вики и пр.
Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании.
- Дорвеи - промежуточные страницы, созданные для накрутки веса страницы при ссылочном ранжировании или для организации Гугл-бомбы . В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной может быть неограниченное число дорвеев. Поисковые машины в ответ удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку «Вход на сайт» или что-то подобное.
- Маскировка , или «клоакинг» - анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь.
Последствия использования поискового спама
- Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то, в связи с активным использованием этих методов для «обмана» поисковых систем, более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что сделало затруднительным поиск «добропорядочных» страниц c редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми «Средние века, поэзия, Восточная Европа», не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова «Средние века, поэзия», вряд ли будет найдена по этим ключевым словам.
Бытует легенда, что поисковый спам в малых дозах может эффективно положительно сказаться на продвижении сайта. Однако всё, что называется спамом, не может нести пользу потребителям, а поисковый спам относится к разряду серого SEO.
Поисковики умеют распознавать SEO спам. В этой статье мы расскажем вам о том, что такое поисковый спам, чтобы вы случайно не создали его на своём сайте.
Виды поискового спама
Поисковый спам можно разделить на четыре вида:
- В тексте статьи.
- В мета-тегах.
- В ссылках.
- В доменном имени (да-да, даже такое бывает).
Все эти виды спама могут быть распознаны поисковыми машинами, и при обнаружении их на сайте, он будет понижен в поисковой выдаче. Поэтому поисковый спам следует исключать. Рассмотрим всё по порядку.
Спам в тексте
Поисковый спам в тексте статьи в филологии называется тавтология. Говоря простыми словами – это повторение одних и тех же фраз (слов) до такой степени, что читать становится неудобно, тошно. Отсюда и появился термин « », который обозначает то же самое.
Спам в тексте можно выразить следующим:
«Мы фирма, которая продаёт шампуни, и у нас можно купить шампуни. Мы продаём шампуни дёшево, делаем доставку купленных шампуней. И ещё вы можете купить у нас шампунь».
Спам в тексте появляется оттого, что автор статьи стремится вписать в него слишком много ключевых запросов в надежде, что это положительно сыграет на ранжировании сайта. Однако результат от этого будет только отрицательный. При написании статьи стремитесь к тому, чтобы её было удобно читать.
Спам в метатегах
Спам в метатегах – это та же самая тавтология, только не в статье, а в мета, то есть в описании и заголовке статьи. Если использовать чрезмерно много ключевых запросов в этих частях страницы, то можно получить негативный результат.
Если учесть, какое влияние мета-тегов на продвижение сайта, то можно понять, что спам в них приведёт к ещё большему негативу, чем в тексте статьи.
Ссылочный спам
Внутренняя перелинковка – это хороший способ для ускорения индексации сайта. Однако если с ним переборщить, то эффект будет отрицательный. Так, если вы создадите, например, десяток ссылок на статьяю с анкором «моя статья», то цена такой перелинковке будет нулевая, и это плохо скажется на продвижении.
Спам доменного имени
Некоторые умудряются купить себе такой домен, в котором использован ключевой запрос. Например, купитьшампуньнедорого.рф или kupitshampun.ru. Это и называется поисковый спам доменного имени. И этого тоже желательно избегать.