Продвигай свой бизнес с помощью Collaborator.
10426 уникальных площадок для размещения статей.

Что такое кластеризация запросов

В этом блоке в рамках курса по семантическому проектированию мы поговорим о теории кластеризации запросов семантического ядра.

Смотреть видео: кластеризация запросов семантического ядра 

Многие SEO задачи требуют группировки данных. В кластеризации нам необходима группировка ключевых слов. Это позволит разбить семантическое ядро по группам. Именно это интересует SEO в кластеризации.

Необходимость группировки:

  • помогает в поиске схожих объектов. Например, мы можем искать их по одному признаку;

  • работать с группами проще, чем с сырыми данными. Сложно обрабатывать ядро на несколько десятков тысяч запросов сразу. Проще разбить их на группы, присвоить им свои посадочные страницы (прорабатывать будем уже именно их), а затем искать шаблоны для похожих групп страниц;

  • можно находить нетипичные объекты. Например, вы создали несколько групп и у вас остались не попавшие ни в одну из них запросы. Это и есть нетипичные объекты. С ними надо работать отдельно: убирать, фильтровать, создавать еще одну группу под них и т. д.;

  • помогает выстраивать иерархию множества. В нашем случае - иерархия раздела или, проще говоря, его структура.

Для сайта это поможет в следующем:

  • сформировать структуру (раздела или сайта);

  • оптимизировать текущую структуру;

  • искать и работать с потенциально сильными кластерами. Объединяя несколько запросов в кластер, мы можем посчитать их суммарную частотность. Это будет потенциал кластера. По этому показателю можно выявить самые сильные и работать только с ними. Правда, при этом нужно учитывать конкуренцию. Высокий потенциал еще не означает легкость продвижения;

  • проверять совместимость продвигаемых запросов. Например, у вас есть запросы «смарт часы» и «умные часы». Тут неясно: пускать их на одну страницу, или на разные. Это как-бы синонимы, но семантически разные слова. Для решения этой проблемы стоит посмотреть кластер, к которому они принадлежат. Если они относятся к одному и тому же, то можно смело продвигать эти запросы на одной странице. Здесь есть свои погрешности, т.к. мы используем кластеризацию по топу. Об этом позже.

Группировка

Группировка бывает двух типов: классификация и кластеризация.   

Элементы классификации:

  • обучение с учителем. Можно обучить классификатор какому-нибудь признаку на выборке (гео, коммерческость);
  • известно количество групп. Например, вы разбиваете запросы на геозависимые и геонезависимые. 2 группы;
  • использование для классификации будущих наблюдений.

Кластеризация:

  • обучение без учителя. Нет первичных признаков, мы ориентируемся на схожесть топов;
  • неизвестно количество групп. Мы не знаем заранее количество разделов у рубрикатора;
  • используется для понимания данных.

В SEO при работе с семантическим ядром чаще используется кластеризация.

Кластеризация на анализе топа поисковой выдачи

Мы сравниваем выдачу по двум разным запросам: топ-10 URL по каждому из них. В зависимости от результата мы можем либо создать кластер из них двоих, либо разбить их по разным кластерам.  

Можно задать порог подобности выдачи. Например, повторение не менее 5 URL. Если это условие соблюдается, то выдача считается подобной и мы можем объединить запросы в кластер. Подразумевается, что мы нашли синонимы или фразы одного интента.  

Существуют свои погрешности. Мы не всегда можем точно определить, что это был один и тот же интент. Об этом чуть позже. Но, в большинстве случаев, кластеры все же объединяются на их подобии.

Степень и правила подобия формируют различные методы кластеризации.

Методы кластеризации

Soft-кластеризация

Мы сравниваем топ-10 URL в выдаче. Если пересечение превышает заданный нами порог, то запросы можно объединить в кластер.

Hard-кластеризация

Подразумевается наличие общего набора URL-ов (3-4), который показывается по всем запросам в топ-10. 

Например, у нас есть 3 ключевых слова. 1 и 2 могут пересекаться по одним типам URL-ов, 2 и 3 по другим, а 1 и 3 могут не пересекаться вовсе. Soft-кластеризация объединила бы их в один кластер - это ее минус. 

Hard-кластеризация этого не допустит. В один кластер они попадут в случае пересечения всех троих по одним и тем же URL-ам (количество пересечений задается вами).  

Soft-кластеризация дает группы большего размера, но часто ошибается в возможности совместного продвижения запросов.

Soft подходит больше для трафиковых проектов, Hard для коммерческих, где нужно вывести на страницу только определенный набор запросов. 

Проблемы кластеризации по топу

  1. Сложно измерять эффективность кластеризации. Нет гарантии, что все запросы в кластере реально продвинуть.
  2. Проблема главных страниц. В один кластер могут попасть запросы, где по одним в выдаче встречаются все главные страницы, а по другим внутренние. Тогда кластер придется разбивать. Нет смысла продвигать такие запросы.
  3. Необходимо подключать дополнительные классификаторы (гео и коммерческость). В один кластер могут попадать запросы коммерческого и информационного типа. Создать страницу под оба невозможно. Поэтому при работе с коммерческими сайтами желательно использовать Hard-кластеризацию, где нет необходимости дополнительно подключать классификатор коммерческости.
  4. Встречаются случаи, когда фразы могут попадать в разные кластеры с одинаковой вероятностью. Это зависит от последовательности проверки. Часто начинают по убыванию с самых частотных запросов. Но если поменять последовательность, то изменятся и кластеры.
  5. Топ постоянно меняется. Происходит это с каждым обновлением выдачи. Поэтому сейчас сформированный вами кластер может довольно быстро потерять актуальность.

Но, несмотря на все минусы, этот метод позволяет автоматизировать ряд рутинных задач и потом вручную обрабатывать эту структуру.