Кластеризация запросов: виды и методы группировки, алгоритмы и софт

Что такое кластеризация

Кластеризацией запросов называют группировку семантического ядра по кластерам. Каждый из них продвигается на отдельных посадочных страницах. Грамотная кластеризация очень важна для ранжирования.

Кластеризуются запросы с учетом схожести поисковой выдачи. К примеру, выдача по информационным и коммерческим запросам будет отличаться. Если продвигать подобные фразы на одной странице, релевантность страницы будет размываться, а значит, поисковики высоких позиций сайту не дадут.

Приведем пример. Ключи «купить сумку» и «купить мужскую сумку» стоит продвигать на одной странице или на разных? Может показаться, что это одно и то же, однако судя по выдаче в ТОП-10 по каждому из запросов, у нее будут отличия.


Выдача ТОП-10 по запросам

Выходит, что сумки и мужские сумки поисковиками характеризуются разным поисковым интентом. Подобные ключи следует продвигать на разных страницах. Однако если у вас большое количество запросов — сотни или тысячи — выдачу по ним вручную проверить не выйдет. В таком случае и поможет кластеризация.

Для чего необходима кластеризация?

  • Благодаря правильно выполненной кластеризации вывести запросы в ТОП-10 удается проще и быстрее, причем без дополнительных затрат. Неправильное распределение запросов по кластерам чревато отсутствием высоких позиций.
  • Позволяет увидеть, как правильно организовать структуру сайта, какие страницы нужно создать впоследствии и какой контент для них нужен.
  • Благодаря группировке запросов по смыслу каждый посетитель сможет находить нужные ему страницы и получать точный и полный ответ на свой вопрос — это сократит количество отказов, увеличит целевой трафик и продажи.

Виды группировки

Поговорим о том, как можно сгруппировать запросы, какой вариант и для каких тематик подойдет. Также упомянем недостатки каждого из видов.

Логическое разбиение

Изучение запросов и предположение, что искал пользователь. Способ подойдет для низкоконкурентных тематик, а также в случае, если тема совершенно новая, у конкурентов по ней контента также мало. Следовательно, состав выдачи будет постоянно меняться, поэтому далеко не факт, что результаты в ней будут релевантны.

Еще один случай, в котором можно использовать логическое разбиение — если в семантическом ядре большое количество низкочастотных запросов. Конкуренция низкая, у поисковиков недостаточно данных о поведении пользователей – поэтому и качество выдачи низкое.

В остальных случаях группировать запросы с точки зрения логики – способ нерациональный, так как достаточно высока вероятность ошибки. К тому же на работу придется потратить много времени, особенно если ядро запросов большое.

Группировка по семантической схожести

Запросы объединяются в одну группу, когда у них есть пересечение общих фраз. К примеру, “купить самокат”, “дюймы самоката”, “авито самокат Москва”. Следовательно, самокат – общее слово, поэтому ключевые слова объединяются в одну группу.

Стоит выделить, что такой вид группировки часто приводит к серьезным ошибкам, так как на одну страницу часто попадают одновременно коммерческие и информационные запросы, а этого делать не стоит – выдача по ним разная.

Также в этом случае не принимается во внимание интент пользователя. Если страница не будет ему соответствовать и пользователь увидит не ту информацию, которую планировал найти – он просто закроет сайт и вернется в выдачу. Такие действия снижают конверсию и поведенческие факторы.

Группировка по ТОПам

Более совершенный вид, поскольку разделение запросов на группы проводится через анализ ТОП-10 поисковой системы, через оценку схожести поисковой выдачи.

Если в выдаче для двух разных запросов есть общие документы, можно допустить, что их можно объединить. Чем больше пересечений, тем более высока вероятность, что ключи можно продвинуть на одной странице. Если общих URL-ов нет, то в большинстве случаев запросы требуется сажать на разные страницы.

Подбираем алгоритм по топам

Для грамотной кластеризации даже для небольшого сайта следует сначала провести группировку семантики по топам поисковой выдачи, а лишь после этого сегментировать спорные ключевые слова вручную. Кластеризация на основании анализа поисковой выдачи может проводиться несколькими способами-уровнями: Soft, Middle, Hard. Рассмотрим каждый из них.

Soft, Middle, Hard - кластеризация

Soft

При мягкой кластеризации все поисковые запросы сравниваются с основным тематико-задающим ключом, который имеет, как правило, наибольшую частотность. В кластер добавляются все ключевые слова, привязанные к URL в поисковой выдаче, пересекающиеся с главным поисковым запросом. Ключевое слово оказывается в кластере семантического ядра, если количество одинаковых URL выше выбранного порога кластеризации. Второстепенные ключевые слова могут даже не пересечься между собой, поэтому в кластер добавляется много поисковых запросов, однако страдает точность группировки.

Метод предназначен для молодых проектов или неконкурентных тематик, где точность сортировки ключевых слов не слишком важна.

Soft-кластеризация подойдет небольшим информационным сайтам или интернет-магазинам, у которых небольшой ассортимент товаров.

Soft-кластеризация также может использоваться, например, для сегментирования семантического ядра сайтов-визиток.

Hard

Это жесткий, однако точный метод сегментации ключевых слов в семантическом ядре, который рекомендуют использовать для высококонкурентных и сложных тематик. При подобном подходе отсеивается множество поисковых запросов, однако удается создать кластер с наиболее релевантными ключевыми словами к тематике посадочной страницы.

При Hard-кластеризации кластер создается лишь в случае пересечения всех ключевых фраз среди URL-адресов, которые входят в топ-10 поиска. Кроме пересечения главного ключевого слова также проводится сравнение вспомогательных поисковых запросов: кластер образуется исключительно при выполнении обоих этих условий.

Порог кластеризации определяет число совпадений не только главного поискового запроса, но и всех входящих в кластер запросов. При этом чем выше порог кластеризации, тем меньше ключевых слов оказывается в кластере семантического ядра.

Middle

Middle-кластеризация — нечто среднее между слабой точностью Soft-метода и жесткостью к отбору Hard-группировки, своеобразный компромисс. Выбирается главный тематико-задающий поисковый запрос, к которому привязываются остальные ключевые слова, прошедшие порог кластеризации по количеству URL в выдаче Google или Яндекс. При этом кластеризатор сравнивает все зависимые с главным запросом ключевые слова друг с другом.

Таким образом поисковые запросы связаны между собой внутри кластера семантического ядра, однако они могут отличаться в разных парах проверяемых URL. У всех ключевых слов в кластере нет задачи пройти пересечение по URL-адресам в топе, сопутствующие поисковые запросы оказываются в группе вместе с тематикозадающим запросом.

Middle-кластеризация используется для информационных ресурсов с большим семантическим ядром или интернет-магазинам в слабоконкурентных нишах. Такой подход позволяет добиться большей точности, чем при Soft-кластеризации, и не допускает отсеивания большинства ключевых слов, как в случае с Hard-группировкой.

Когда группировка по ТОПу дает некорректный результат?

Когда группировка по ТОПу может “обманывать” и давать некорректный результат? На самом деле таких ситуаций немало, как минимум пять:

  1. Вы неправильно выявили и поставили пороги. Иными словами, вы сказали, что нам достаточно одного одинакового адреса в выдаче по двум разным запросам, и у вас получилось, что определенный случайный документ, например, Википедия, есть в ТОПе по 300 запросам. У вас, соответственно, будет сформирован огромный кластер в 300 запросов, и вы можете подумать, что вы сейчас создадите один документ и продвинете сразу 300 запросов. Это первая проблема.
  2. Новая тематика, которая не так давно возникла. Выдачу пока еще сильно “штормит”, все время появляются новые статьи, новостные результаты с разных типов ресурсов. В таком случае, скорее всего, именно кластеризация по ТОПу сильно не поможет, поскольку состав выдачи постоянно сильно меняется. И не факт, что он вообще релевантен потребностям пользователей. То есть интент всегда первичен. Это вторая частая существующая проблема.
  3. У вас много микро- и низкочастотных запросов, а также запросов длиной 6 слов и более. В таком случае, скорее всего, у поисковой системы будет недостаточно данных о поведении пользователя на выдаче, качество выдачи тоже, скорее всего, низкое. Если вы кластеризуете подобные низкочастотные «хвосты», то имеет смысл обращать внимание и на потребность пользователя. Иначе кластеризация не будет работать достаточно идеально.
  4. Достаточно редкий, но интересный кейс, когда в выдаче большое количество результатов с одного сайта. Многие кластеризаторы начинают в такой момент врать. Например, если мы собираем тематику по кредитам и у нас содержится слово «кредит Сбербанк», и вы планируете попасть в ТОП по этому запросу. В таком случае результатов с Альфа-банка может хватать для того, чтобы склеивать большое количество запросов, отличающихся по потребности, в один кластер просто потому, что в выдаче есть подробный ответ и несколько результатов с одного сайта. Когда подобное встречается, следует провести дополнительную рекластеризацию, пересмотр кластеров.
  5. Большое количество «примесей». В случае, если вы не фильтруете результаты на входе, скорее всего, вы получите слишком большое количество мелких групп (когда похожие близкие запросы можно было бы объединить, если бы вы почистили выдачу и у было бы больше одинаковых URL-адресов в выдаче).

Выше представлено минимум пять кейсов, в рамках которых группировка по ТОПу может работать неидеально. Поэтому когда говорят, что сделали по группировке и дальше будут действовать исходя из нее, на самом деле это не совсем так.

Что делать?

Конечно, для каждого случая выбирать подходящий вариант. Стоит понимать, что группировка может сильно врать лишь в крайних случаях. Но даже если у вас устоявшаяся тематика, всегда необходимо и оценивать интент пользователя. Самостоятельно предполагать, что он хочет получить в ответ. Я даю некую технологию, однако конечное решение о том, какой конкретно URL-адрес продвигать и с какой целью, принимать вам.

Также следует применять метод и «силу». Следует «прогонять» семантику с несколькими порогами, то есть уровень «силы» может быть 2, 3, 4. То есть количество одинаковых URL-адресов по разным документам, которое должно быть минимальным в топе, чтобы эти запросы по категории могли быть сформированы в кластер. Также в ряде случаев можно «прогонять» в другой поисковой системе.

Способы кластеризации

Группировка, как говорилось ранее, может проводиться вручную и с применением специальных программ.

  1. Ручная. Занимает достаточно много времени, практически невозможна на крупных проектах, к тому же велика вероятность человеческого фактора.
  2. Сервисы. Дают возможность работать с большим объемом данных, но не всегда позволяют получить качественный результат.

Поэтому оптимально использовать оба способа в комплексе: сначала делите запросы на группы в автоматическом формате, после этого — проверяйте полученные результаты вручную по описанным выше принципам. Прежде чем пользоваться инструментом, лучше читать, по какому методу он работает, поскольку среди них встречаются те, что сравнивают схожесть лишь по словоформам, а не выдаче — например, Mc-Castle.ru или программа МегаЛемма.

Сервисы и приложения

Для кластеризации семантики по анализу поисковых топов можно использовать десктопное ПО или полезные онлайн - сервисы. Различие — в скорости, функциональности и цене. Удобно, что при необходимости у достойных сервисов всегда доступна связь с поддержкой — опытный человек подскажет, как провести регистрацию, запустить программу, создавать проекты, как проходит процесс кластеризации и т.д. Также, чтобы понять, как пользоваться набором функций любой программы, можно посмотреть инструкции.

Рассмотрим, какой вариант кластеризации предпочтительнее исходя из задач оптимизатора.

Панель Key Collector

Программы для кластеризации семантики

Desktop-программы предлагают более широкую функциональность, нежели онлайн-сервисы, что дает возможность тонко выбирать параметры группировки поисковых запросов или настраивать интерфейс софта. У офлайн-программ для кластеризации есть ряд преимуществ и недостатков:

Плюсы :

  1. Можно гибко настроить параметры кластеризации и редактировать семантическое ядро внутри программы.
  2. Возможность целиком автоматизировать работу с семантикой в зависимости от выбранного региона. Например, с помощью Key Collector ядро можно спарсить, очистить и сразу кластеризовать.
  3. Desktop-программы поддерживают больше форматов для импорта и экспорта, а также дают возможность создать шаблон с настройками для последующей удобной работы с семантикой.

Минусы:

  1. Кластеризация выполняется автоматически на компьютере пользователя: для работы с большим семантическим ядром необходим стабильный интернет и производительное железо.
  2. Все функциональные качественные программы для кластеризации платные, стоимость и тарифы отличаются. Например, цена наиболее популярного Key Collector — 2 200 рублей.
  3. Интерфейс desktop-программ сложнее, чем у онлайн-сервисов. Для удобной работы, как правило, приходится проходить обучение и просматривать гайды.

Наиболее популярным софтом для эффективной кластеризации являются AllSubmitter, KeyClusterer и Key Collector, однако есть и другие не менее достойные инструменты.

Пример кластеризации в Key Collector

Рассмотрим пример группировки семантического ядра на основе анализа поисковой выдаче на примере Key Collector — пожалуй, обязательного инструмента для каждого SEO - специалиста.

Прежде чем приступить к кластеризации, в программу необходимо загрузить все семантическое ядро и указать название проекта. Если данные собирались в Key Collector, следует открыть сохраненный файл программы, если со сторонней программы — нужен импорт. Для импорта файлом или добавления вручную скопированных поисковых запросов переходим в раздел «Главная», где нужно выбрать «Добавить фразы». Далее вставляем скопированную семантику или указываем адрес к файлу на компьютере:


Добавляем фразы в Key Collector

Для группировки следует провести сбор частотности по всем фразам — это можно сделать здесь же, в программе.

Отмечаем галочкой все поисковые запросы и переходим в раздел «Данные», где следует нажать «Анализ групп». Теперь выбираем параметр «По поисковой выдаче (улучшенная)», отмечаем поисковые системы и количество URL в выдаче для анализа. Далее нужно выбрать из списка силу SERP для кластеризации — для семантики, где преобладают двух- или трехсловные поисковые запросы, будет достаточно порога в 3 пересечения.

Показан пример Soft-кластеризации методом «объединения» запросов. Для проведения Hard-кластеризации режим группировки в настройках требуется заменить на «пересечение». При обновлении семантического ядра процедуру кластеризации нужно повторить.

Онлайн-сервисы

Более простой подход к кластеризации предполагает использование онлайн-сервисов. Это позволяет обработать семантику быстрее и не требует обучения, как в случае с профильным софтом. Здесь также есть определенные преимущества и недостатки:

Плюсы :

  1. Кластеризация проводится в максимально удобном формате — всего в пару кликов. Оптимизатору не придется вникать в сложные технические нюансы. Интерфейс крайне дружественен пользователям
  2. Для разовых или нерегулярных работ онлайн-сервисы — самый удобный инструмент для кластеризации.

Минусы:

  1. Сервисы не могут обрабатывать большие семантические ядра.
  2. У онлайн-сервисов немало ограничений: по количеству проверок, числу ключевых слов в ядре.
  3. В долгосрочной перспективе приобретение профильного ПО выходит выгоднее и практичнее.

Распространенные ошибки

Теперь можно рассказать о самых часто совершаемых ошибках при кластеризации запросов, а также о том, к чему они могут привести.

  1. Смешивать коммерческие и информационные запросы.
  2. Объединять несколько интентов на одной странице.
  3. Выбирать запросы, которые не соответствуют тематике сайта компании.
  4. Составлять семантическое ядро без синонимов ключевых слов и фраз.
  5. Ключевые слова содержат ошибки.
  6. Маленькое семантическое ядро без низкочастотных запросов.
  7. Слишком большое количество ключей в одном кластере.
  8. Дубли, нулевые, ошибки в словах, спецсимволы в семантике.

Из-за подобных ошибок охват собранной семантики низкий, тип содержания страницы не соответствует поисковому запросу либо сразу несколько страниц сайта отвечают на один и тот же запрос пользователя. Следовательно, все это приводит к размытию релевантности и ухудшению поведенческих факторов.

Пример

Один из способов упрощения кластеризации мы описали в данной статье

Заключение

Группировка нужна, чтобы наилучшим образом с позиции поисковых систем распределить запросы по посадочным страницам. Это один из главных этапов построения семантического ядра, поскольку в случае ошибок все дальнейшие работы по оптимизации потребуется переделывать. От результатов кластеризации во многом зависит объем требуемого контента, его содержание, определение и распределение внутренней и внешней ссылочной массы внутри сайта, сформированная структура и некоторые другие факторы. А самое главное — позиции сайта по подобранным запросам!

Ни один сервис кластеризации, будь он платный или бесплатный, не сможет гарантировать идеальный результат. Кластеры, которые получаются в итоге, необходимо тщательно анализировать, смотреть и пробовать разные варианты точности кластеризации.

Помните: кластеризацию нельзя сделать только один раз и навсегда. Выдача со временем неизбежно меняется, где раньше был коммерческий запрос, через пару месяцев может появиться информационный. Поэтому периодически пересматривайте семантику, раз в год или чаще удаляйте запросы, которые уже не актуальны, добавляйте новые и своевременно вносите нужные правки на сайт.

Оставить комментарий
Комментарии

Пусто

Артем Опарин

Обсудим ваш проект бесплатно

Сделайте заказ прямо сейчас, и уже сегодня мы приступим к работе!
Заполняя данную форму вы соглашаетесь на обработку персональных данных в соответствии с законом №152-ФЗ "О персональных данных"