Продвигай свой бизнес с помощью Collaborator.
12898 уникальных площадок для размещения статей.

Что такое кластеризация запросов

Эта публикация обновлена 19 апреля 2021

В этом блоке в рамках курса по семантическому проектированию мы поговорим о теории кластеризации запросов семантического ядра.

Смотреть видео: кластеризация запросов семантического ядра 

Многие SEO задачи требуют группировки данных. В кластеризации нам необходима группировка ключевых слов. Это позволит разбить семантическое ядро по группам. Именно это интересует SEO в кластеризации.

Необходимость группировки:

  • помогает в поиске схожих объектов. Например, мы можем искать их по одному признаку;

  • работать с группами проще, чем с сырыми данными. Сложно обрабатывать ядро на несколько десятков тысяч запросов сразу. Проще разбить их на группы, присвоить им свои посадочные страницы (прорабатывать будем уже именно их), а затем искать шаблоны для похожих групп страниц;

  • можно находить нетипичные объекты. Например, вы создали несколько групп и у вас остались не попавшие ни в одну из них запросы. Это и есть нетипичные объекты. С ними надо работать отдельно: убирать, фильтровать, создавать еще одну группу под них и т. д.;

  • помогает выстраивать иерархию множества. В нашем случае - иерархия раздела или, проще говоря, его структура.

Для сайта это поможет в следующем:

  • сформировать структуру (раздела или сайта);

  • оптимизировать текущую структуру;

  • искать и работать с потенциально сильными кластерами. Объединяя несколько запросов в кластер, мы можем посчитать их суммарную частотность. Это будет потенциал кластера. По этому показателю можно выявить самые сильные и работать только с ними. Правда, при этом нужно учитывать конкуренцию. Высокий потенциал еще не означает легкость продвижения;

  • проверять совместимость продвигаемых запросов. Например, у вас есть запросы «смарт часы» и «умные часы». Тут неясно: пускать их на одну страницу, или на разные. Это как-бы синонимы, но семантически разные слова. Для решения этой проблемы стоит посмотреть кластер, к которому они принадлежат. Если они относятся к одному и тому же, то можно смело продвигать эти запросы на одной странице. Здесь есть свои погрешности, т.к. мы используем кластеризацию по топу. Об этом позже.

Группировка

Группировка бывает двух типов: классификация и кластеризация.   

Элементы классификации:

  • обучение с учителем. Можно обучить классификатор какому-нибудь признаку на выборке (гео, коммерческость);
  • известно количество групп. Например, вы разбиваете запросы на геозависимые и геонезависимые. 2 группы;
  • использование для классификации будущих наблюдений.

Кластеризация:

  • обучение без учителя. Нет первичных признаков, мы ориентируемся на схожесть топов;
  • неизвестно количество групп. Мы не знаем заранее количество разделов у рубрикатора;
  • используется для понимания данных.

В SEO при работе с семантическим ядром чаще используется кластеризация.

Кластеризация на анализе топа поисковой выдачи

Мы сравниваем выдачу по двум разным запросам: топ-10 URL по каждому из них. В зависимости от результата мы можем либо создать кластер из них двоих, либо разбить их по разным кластерам.  

Можно задать порог подобности выдачи. Например, повторение не менее 5 URL. Если это условие соблюдается, то выдача считается подобной и мы можем объединить запросы в кластер. Подразумевается, что мы нашли синонимы или фразы одного интента.  

Существуют свои погрешности. Мы не всегда можем точно определить, что это был один и тот же интент. Об этом чуть позже. Но, в большинстве случаев, кластеры все же объединяются на их подобии.

Степень и правила подобия формируют различные методы кластеризации.

Методы кластеризации

Soft-кластеризация

Мы анализируем конкурентов и сравниваем топ-10 URL в выдаче. Если пересечение превышает заданный нами порог, то запросы можно объединить в кластер.

Hard-кластеризация

Подразумевается наличие общего набора URL-ов (3-4), который показывается по всем запросам в топ-10. 

Например, у нас есть 3 ключевых слова. 1 и 2 могут пересекаться по одним типам URL-ов, 2 и 3 по другим, а 1 и 3 могут не пересекаться вовсе. Soft-кластеризация объединила бы их в один кластер - это ее минус. 

Hard-кластеризация этого не допустит. В один кластер они попадут в случае пересечения всех троих по одним и тем же URL-ам (количество пересечений задается вами).  

Soft-кластеризация дает группы большего размера, но часто ошибается в возможности совместного продвижения запросов.

Soft подходит больше для трафиковых проектов, Hard для коммерческих, где нужно вывести на страницу только определенный набор запросов. 

О сборе семантического ядра и кластеризации запросов подробно рассказывает Сергей Кокшаров в бесплатном курсе по SEO продвижению сайтов, который доступен в Академии Коллаборатора.  

Проблемы кластеризации по топу

  1. Сложно измерять эффективность кластеризации. Нет гарантии, что все запросы в кластере реально продвинуть.
  2. Проблема главных страниц. В один кластер могут попасть запросы, где по одним в выдаче встречаются все главные страницы, а по другим внутренние. Тогда кластер придется разбивать. Нет смысла продвигать такие запросы.
  3. Необходимо подключать дополнительные классификаторы (гео и коммерческость). В один кластер могут попадать запросы коммерческого и информационного типа. Создать страницу под оба невозможно. Поэтому при работе с коммерческими сайтами желательно использовать Hard-кластеризацию, где нет необходимости дополнительно подключать классификатор коммерческости.
  4. Встречаются случаи, когда фразы могут попадать в разные кластеры с одинаковой вероятностью. Это зависит от последовательности проверки. Часто начинают по убыванию с самых частотных запросов. Но если поменять последовательность, то изменятся и кластеры.
  5. Топ постоянно меняется. Происходит это с каждым обновлением выдачи. Поэтому сейчас сформированный вами кластер может довольно быстро потерять актуальность.

Но, несмотря на все минусы, этот метод позволяет автоматизировать ряд рутинных задач и потом вручную обрабатывать эту структуру.

А в следующей лекции вы узнаете, какие есть инструменты для кластеризации запросов

Также при работе с семантикой обязательно знать, что такое LSI фразы и какие есть сервисы для сбора LSI