Погрешность данных: сравнение Ahrefs, Semrush и Similarweb
Попробуйте Collaborator.pro
Выберите из 35970 высококачественных веб-сайтов и 3430 Telegram каналов
ВперёдМожно ли доверять цифрам? Казалось бы, более точного показателя не придумать. Однако этот вопрос так или иначе возникает каждый раз, когда аналитики демонстрируют клиентам отчеты, в которых SEO-данные из разных источников не совпадают.
Так почему важные метрики популярных SEO-инструментов часто различаются, и то очень даже существенно? И главное — каким сервисам можно доверять при принятии стратегических решений в сфере поисковой оптимизации? Давайте разбираться!
Детали — в видео с докладом Владислава Тришкина с конференции Collaborator 11.10.2024👈
Цель и методология исследования точности SEO-сервисов
Исследование команды Promodo началось именно благодаря неудобным, но логичным вопросам клиентов. Чтобы вооружиться на будущее аргументированными ответами относительно точности SEO-сервисов, Владислав Тришкин и команда маркетингового агентства поставили перед собой задачи:
- Исследовать уровень погрешности популярных SEO-тулов: SEMrush, SimilarWeb и Ahrefs.
- Собрать доказательную базу и аналитические данные на основе выборки сайтов для выявления закономерностей в несоответствиях.
- Сделать выводы, которые помогут SEO-специалистам более эффективно объяснять результаты клиентам и строить стратегии на основе реальных данных.
Чтобы получить максимально объективную и полную картину, для анализа взяли выборку из 184 сайтов из разных гео, ниш и разного объема трафика:
Анализировали данные за первое полугодие 2024 года из таких источников:
- Google Search Console — как референс для фактических показателей.
- Ahrefs, SimilarWeb, SEMrush — для сравнения «синтетических» данных, которые они рассчитывают.
В ходе исследования удалось выявить уровень погрешности — насколько отличаются показатели этих сервисов от данных GSC. А кроме того еще и обнаружили интересные закономерности и аномалии, например, сервисы, которые систематически завышают или занижают показатели.
Несмотря на то, что методология звучит просто, за этим стоит огромное количество данных, которые требовали глубокого анализа. Изучали даже мелкие аномалии, чтобы получить максимально точные результаты. Это позволило не только определить среднестатистическую погрешность, но и понять, какие особенности есть у каждого сервиса.
Полученные результаты помогают оценить надежность данных, которые вы используете, и лучше понять ограничения аналитических инструментов. Это знание пригодится каждому SEO-специалисту, который хочет избегать ошибок и улучшать качество своих стратегий.
Особенности расчета трафика SEMrush, SimilarWeb и Ahrefs
Каждый SEO-сервис имеет свою уникальную систему расчета трафика, что отражается на точности данных. Далее разберемся, как SEMrush, SimilarWeb и Ahrefs оценивают трафик сайтов, исследуем их подходы, преимущества и слабые стороны.
SEMrush: как анализирует данные о трафике
SEMrush для аналитики и оценки трафика использует петабайты данных о кликах, полученные из многих сторонних источников, хотя конкретные ресурсы не раскрываются.
Органический трафик оценивается через анализ позиций ключевых слов с применением модели прогнозирования, где CTR умножается на объем поиска по определенному запросу. Такой подход обеспечивает хорошую оценку органического трафика для средних и крупных сайтов, но для ресурсов с небольшим трафиком (<5000 кликов/месяц) точность существенно снижается. Также этот сервис предоставляет только оценочные данные, а не фактические, что предполагает определенную погрешность.
SimilarWeb: как работает система расчета трафика
SimilarWeb использует четыре основных источника данных: прямые измерения (информация от сайтов, которые предоставили доступ к собственным системам внутреннего трекинга), информацию о поведении пользователей через Contributory Network, цифровые сигналы от партнерских организаций, а также данные, собранные с огромного количества веб-сайтов с помощью алгоритмического продукта Public Data Extraction.
Существенное преимущество SimilarWeb — подробная информация обо всех каналах трафика, включая органический, PPC и реферальный. Предоставляются детальные отчеты в удобном формате с возможностью сравнения конкурентов.
После глобального обновления системы трекинга в конце июля 2024 года точность анализа улучшилась. Были подключены дополнительные параметры для учета не только фактических изменений, но и сезонных изменений трафика, а также добавили информацию, которая улучшила их понимание трафика именно с мобильных девайсов.
Оценка данных для сайтов с малым трафиком остается неточной, поскольку сервис зависит от большого объема данных, полученных из вышеупомянутых источников.
Ahrefs: как вычисляются показатели трафика
Система анализа Ahrefs базируется на поисковых запросах, их количестве (то есть спросе) и собственных «уникальных расчетах» CTR. Данные сервиса довольно точные, однако только для сайтов со стабильными позициями. Если изменения в SERP происходят быстро, а данные бот Ahrefs еще не обновил, система показывает не актуальные данные по трафику. Кроме того, этот сервис не предоставляет итоговой оценки месячного трафика, что может затруднять анализ в длительном временном периоде.
Простыми словами: в Ahrefs используют систему измерения, когда каждый день показывается примерный месячный трафик, исходя из текущих видений позиций, CTR и поисковых запросов. А это значит, что есть много моментов, где именно может возникнуть погрешность данных.
Результаты исследования точности SEO-сервисов: средний процент погрешности
Проанализировав каждый сервис, а это огромные массивы данных, удалось рассчитать средний процент погрешности. Далее — подробно по каждому сервису.
SEMrush продемонстрировал среднюю погрешность на уровне 61,58%, причем чаще сервис завышал трафик (в 112 из 184 сайтов). Встречались и определенные аномалии: в некоторых случаях SEMrush мог оценить трафик в 130 тыс., когда реальный объем составлял 50 тыс. В то же время имелись и минимальные отклонения, близкие к фактическим значениям.
В SimilarWeb процент погрешности меньше — 56,95%. Лучшие результаты, вероятно, связаны с обновлением системы в июле 2024 года. До этого момента уровень погрешности был значительно выше, после — показатели стали ближе к реальным, хотя сервис и дальше имеет тенденцию к завышению данных.
SimilarWeb чаще, чем SEMrush и Ahrefs, демонстрировал результаты с минимальной погрешностью, приближенные к фактическому трафику. Аномалии более 100% также встречались, но благодаря общей тенденции к улучшению можно ожидать, что точность в дальнейшем будет расти.
Ahrefs занял первое место по точности и лучший процент погрешности — 48,63%. В большинстве случаев этот сервис демонстрировал показатели, более близкие к реальным, но с тенденцией к занижению трафика. Аномальные погрешности практически отсутствовали, но случаев с минимальными отклонениями тоже почти не наблюдалось.
Средний уровень погрешности для исследуемых инструментов составляет около 50%. Однако в процессе исследования точности SEO-сервисов были выявлены аномальные случаи, когда результаты существенно отличались от реальных. Такие расхождения не зависели от ниши или размера сайтов, что свидетельствует об ограничении методологий каждого сервиса.
Эти результаты подтверждают необходимость проверки данных в нескольких сервисах одновременно, чтобы минимизировать вероятность существенных погрешностей. Кроме того, важно понимать, что точность оценок зависит от таких факторов, как CTR, которые являются очень динамичными данными, изменения в поисковых позициях, а также от способности сервисов оперативно обновлять свои данные.
Как самостоятельно рассчитать трафик: пошаговый гайд
Такие расчеты можно делать самостоятельно. Конечно, они также будут иметь определенную погрешность, однако важное преимущество этого метода заключается в том, что вам не потребуются специализированные сервисы.
Для того чтобы провести расчет трафика, понадобится следующая информация:
- максимально полное семантическое ядро;
- CTR для топ 10;
- срез по позициям и частотности.
Для начала соберите все релевантные высоко-, средне- и низкочастотные запросы по странице, категории, сайту, которые хотите анализировать. Срез позиций и частотности позволит оценить видимость сайта по выбранным ключам.
Чтобы определить CTR, проще всего — использовать средние показатели из сервисов вроде Advanced Web Ranking. Он показывает текущие актуальные тенденции по CTR, но погрешность данных будет велика из-за разницы в выдачах в зависимости от ниш, гео и наличия различных блоков в SERP (People Also Ask, Local Pac, Images, блока расширенной выдачи).
Второй вариант — собрать данные из Google Search Console. Отфильтруйте запросы по категориям, исключив брендовые. Рассчитайте средний CTR для каждой позиции (идеально — от 1 до 10). Вы получите данные, которые базируются на истории вашего сайта.
Далее переходим к подсчету трафика:
- Создайте таблицу с такими данными: запрос, частотность, текущая позиция, CTR для этой позиции.
- Формула расчета: Трафик = (Частотность × CTR) ÷ 100
- Суммируйте результаты для всех запросов, чтобы получить приблизительный общий объем возможного трафика в месяц.
Метод эффективен для анализа отдельных страниц или категорий, однако для масштабных проектов (весь сайт или анализ конкурента) он займет немало времени и ресурсных затрат.
Ключевые выводы
От внешних сервисов не стоит ждать максимальной точности. Они будут иметь определенную погрешность при пересчете объемов органики, потому что есть моменты, которые практически нереально отслеживать в режиме реального времени, и именно они очень часто вызывают эту погрешность. Поэтому при построении SEO-стратегии, при анализе конкурентов учитывайте, что эти данные внешних сервисов приблизительные, а не фактические.
Если у вас есть возможность, пробуйте сами делать расчет трафика для страницы или пула страниц, которые вам интересны.
Вопрос-Ответ
Почему показатели Ahrefs (Linked websites) не совпадают с данными их бесплатного инструмента — чекера линков?
Этот вопрос стоит адресовать в службу поддержки Ahrefs. По моему опыту, такие сервисы обычно не раскрывают деталей о том, как именно они собирают и обрабатывают данные. Из-за этого подобные запросы часто остаются без конкретного ответа.
Какими сервисами вы пользуетесь для анализа взаимодействия с брендом конкурентов в социальных сетях за определенный период?
Я специализируюсь на SEO и не работаю непосредственно с социальными сетями. Однако для анализа кросканального взаимодействия, например, SEO и PPC, могу посоветовать некоторые подходы.
Одним из распространенных примеров является так называемая «каннибализация PPC», когда настройки платной рекламы начинают отбирать часть органического трафика — как в категориях, так и на уровне брендовых запросов.
Для анализа таких взаимодействий использую Similarweb.
Какому показателю из исследованных инструментов можно доверять больше всего? Или оптимально — вывести среднее значение по сервисам?
Например, Ahrefs показывает 86,3 тыс., Semrush — 133,7 тыс., а Similarweb — 3,6 млн. При этом показатель Similarweb, скорее всего, является результатом аномалии. Этот инструмент иногда дает слишком высокие значения из-за особенностей сбора данных.
В таком случае я бы больше доверял Ahrefs: хоть он часто занижает оценки трафика, его подсчеты базируются на фактических данных. Ключевые слова, их частотность, CTR — все это учитывается для расчета.
Реальные цифры, по моему мнению, где-то посередине между показателями Ahrefs vs Semrush — около 110 тыс.
Зависел ли показатель погрешности от ниши или географии? Одинаково ли Ahrefs точен во всех случаях?
Ahrefs показывает стабильно точные результаты независимо от ниши или географии. Мы анализировали разные тематики, сравнивали показатели для разных сайтов, и во всех случаях Ahrefs был лучше. Его методика оценивания работает консервативно: погрешность данных обычно составляет 30-50% в меньшую сторону, без резких отклонений.
Similarweb иногда дает отличные результаты с минимальной погрешностью, зависимость от ниши или других факторов выявить также не удалось.
Потенциал больше у Similarweb и SEMrush, где работает кастомная модель расчета, но пока модель Ahrefs лучше работает.
На какое количество ключевых слов в топ 10 и топ 3 рассчитываете при оценке потенциального трафика?
Конечно, мы берем максимально полное ядро. Если рассчитываем потенциальный трафик на определенный промежуток времени, то для детальной аналитики нужно максимальное количество поисковых запросов.
Какие результаты у Serpstat и SE Ranking?
О SE Ranking не могу дать обоснованную оценку. А вот Serpstat, считаю, находится на одном уровне с Ahrefs. В некоторых случаях база запросов даже выигрывает. Ожидаю от Serpstat такую же погрешность, как и у Ahrefs.
Спасибо Владиславу за интересное исследование и практический доклад. В Академии Collaborator можете посмотреть все доклады приглашенных спикеров с осенней конференции 2024.
А еще приглашаем участвовать в бесплатных вебинарах. Ознакомиться с расписанием ивентов и зарегистрироваться можно здесь👈