Разъяснения по AhrefsBot: стоит ли его блокировать или позволить ему ползать?

Последнее обновление: 01

Если у вас есть веб-сайт, вы наверняка встречали слово «Арефсбот» в журналах вашего сервера или отчетах веб-аналитики. Но что такое AhrefsBot и стоит ли вам беспокоиться о его присутствии на вашем сайте?

Ahrefsbot регулярно сканирует ваш сайт. Он ведет себя так же, как робот Googlebot: приходит и исчезает, когда хочет. Это не всегда проблема, но ситуация может быть значительно хуже, если она перегружает ваш сервер и замедляет работу вашего сайта.

Итак, вопрос в том, какое место в этом спектре занимает Ahrefsbot?

Это друг или враг вашего сайта?

Давайте изучим!

Что такое Ahrefsbot?

AhrefsBot — это веб-сканер от Ahrefs, ведущего на рынке SEO-решения. Этот бот непрерывно исследует интернет 24 часа в сутки, 7 дней в неделю, создавая и обновляя базу обратных ссылок, что позволяет Ahrefs предоставлять своим пользователям самые точные и актуальные данные.

Это один из самых активных сканеров Интернета. Каждую минуту AhrefsBot сканирует 5 миллионов веб-страниц. По данным сторонних исследований, он превосходит сканеры Yahoo и Яндекс и, несомненно, является самым активным сканером среди других Поставщики инструментов SEO

Ahrefsbot продемонстрировал исключительные успехи в своей роли, выведя компанию на вершину отрасли с годовым регулярным доходом (ARR) 100 миллионов долларов к 2023 году.

Бот индексирует актуальную и достоверную информацию о веб-сайтах, их контенте и их взаимосвязях. Эти данные полезны и могут быть использованы различными способами:

  • Поиск с помощью Yep to доступ качественный контент и всю необходимую вам информацию, одновременно поддерживая альтернативную поисковую систему, призванную приносить деньги в карманы ваших любимых создателей контента.
  • Если у вас есть веб-сайт, используйте Ahrefs для анализа его структуры, содержания и обратные ссылки чтобы получить представление о его работе. Затем оптимизируйте его, чтобы улучшения пользовательский опыт, улучшить рейтинг в поисковых системах, и увеличить трафик.
  • Когда речь идет об исследованиях в масштабе сети, Ahrefs позволяет отслеживать рост популярности веб-сайта или определенной темы с течением времени, определять, какие веб-сайты ссылаются на определенные типы контента, а также определять, как часто в последнее время упоминался тот или иной бренд, и другие показатели.

Кроме того, AhrefsBot, как и любой хороший бот, тщательно соблюдает правила, прописанные в файлах robots.txt, не показывает рекламу на сайтах и ​​не занимается искусственным завышением трафика Google Analytics.

Как работает AhrefsBot?

Ahrefsbot сканирует как можно больше сайтов. Он собирает качественные данные о ссылках при каждом сканировании и возвращает их в базу данных Ahrefs.

Вот краткий обзор того, как работает AhrefsBot:

а. Ползание

AhrefsBot начинает с сканирования Интернета, доступа к веб-сайтам и запроса страниц с серверов. Каждые 24 часа он ищет 6 миллиардов веб-страниц и обновляет индекс ссылок каждые 15 до 30 минут. В процессе сканирования он переходит по ссылкам на страницах в поисках нового контента. Цель состоит в том, чтобы создать полный индекс онлайн-страниц.

б. Открытие новых страниц

AhrefsBot находит новые страницы, переходя по ссылкам на существующие в своем индексе. Это помогает ему идентифицировать и индексировать новую информацию по мере ее появления в Интернете.

в. Сбор данных

AhrefsBot сканирует страницы и собирает данные по различным переменным, связанным с SEO, включая, помимо прочего:

1. Обратные ссылки: AhrefsBot находит и отслеживает обратные ссылки на определенную страницу, включая ссылающийся домен и якорный текст.

2. Ключевые слова: Он анализирует содержимое страницы для определения целевых ключевых слов.

3. Компоненты SEO на странице: AhrefsBot может собирать данные об элементах страницы, включая метатеги, заголовки и другие аспекты, связанные с SEO.

д. Аудит сайта

AhrefsBot проводит аудит сайта, включая комплексный анализ сайта на предмет распространенных проблем SEO, таких как неработающие ссылки, дублированный контент, отсутствующие метатеги и другие ошибки на странице и технический SEO проблемы.

е. Индексирование

Данные AhrefsBot затем анализируются и индексируются в базе данных Ahrefs. Пользователи Ahrefs могут получить доступ к этим индексированным данным через платформу Ahrefs, а также получить доступ к своим сайтам и сайтам конкурентов.

ф. Регулярные обновления

Бот Ahrefs часто посещает сайты, чтобы обновить свой индекс. Это гарантирует, что Пользователи Ahrefs получают самую актуальную информацию о своем сайте производительности и производительности конкурентов в своей области.

г. Уважение к метатегам Robots.txt и Noindex.

AhrefsBot, как и другие веб-сканеры, следует ограничениям, установленным веб-сайтами через файл robots.txt и метатеги, такие как «noindex» и «nofollow». Если веб-сайт предписывает AhrefsBot не сканировать определенные страницы или части, он будет следовать этим инструкциям.

Строка User-Agent AhrefsBot (последняя версия)

Анализируя логи сервера или отслеживая активность ботов, вы часто сталкиваетесь с AhrefsBot — официальным поисковым роботом, используемым в SEO-инструментарии Ahrefs. Он сканирует сайты, собирая данные об обратных ссылках и ключевых словах для базы данных Ahrefs.

Вот последний Строка пользовательского агента AhrefsBot вы обычно увидите:

lessCopyEditMozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)

Этот user-agent идентифицирует робота при посещении им вашего сайта. Ссылка на эту строку необходима для блокировки AhrefsBot или фильтрации его активности. Большинство журналов сервера регистрируют эту строку при сканировании Ahrefs вашего сайта, что упрощает обнаружение.

Примечание: вы также можете проверить, исходит ли сканирование от настоящего AhrefsBot, воспользовавшись их официальным инструментом проверки.

Независимо от того, настраиваете ли вы robots.txt или защищаете свой сайт от ненужных ботов, знание этого пользовательского агента поможет вам принять обоснованные меры.

Преимущества Ahrefsbot

Ahrefs хорошо известен своим полным анализом обратных ссылок и возможностями, связанными с SEO. AhrefsBot собирает данные для индекса Ahrefs и предоставляет полезную информацию тем, кто пытается улучшить SEO-эффективность своего сайта.

Вот некоторые преимущества, предлагаемые Ahrefsbot:

1. Практические данные SEO

Данные Ahrefsbot чрезвычайно ценны для SEO-специалистов и маркетологов. Собираемые им данные помогают SEO-специалистам и маркетологам оптимизировать свои сайты для ведущих поисковых систем, таких как Google.

Разрешение Ahrefsbot сканировать ваш сайт гарантирует постоянное обновление его базы данных. Ваш веб-сайт предоставляет наиболее точные данные, которые вы можете сравнить с данными конкурентов.

Это поможет вам:

  • Оптимизируйте свой сайт.
  • Расставьте приоритеты, над чем вам нужно поработать, чтобы улучшить свой рейтинг.

2. Веб-сканирование

AhrefsBot сканирует Интернет и индексирует сайты так же, как это делают боты поисковых систем. Он идентифицирует и собирает данные с веб-сайтов, создавая полную базу данных, к которой могут получить доступ пользователи Ahrefs.

3. Анализ обратных ссылок

Одна из ключевых функций Ahrefs — инструмент анализа обратных ссылок. Он упрощает сбор данных об обратных ссылках, таких как количество ссылок, ссылающиеся домены, анкорный текст и т. д. Эта информация полезна для SEO специалисты которые хотят понять ссылочный профиль своего сайта и конкурентов.

4. Ключевое слово исследований

Ahrefs предоставляет набор инструментов для исследования ключевых слов. AhrefsBot помогает находить новые и существующие страницы, релевантные заданным ключевым словам, предоставляя данные, необходимые для анализа ключевых слов, такие как поисковый трафик, сложность ключевых слов и т.д. рейтинг кликов.

5. Отслеживание рангов

Ahrefs позволяет пользователям следить за своим веб-сайтом рейтинги по определенным ключевым словам Со временем. AhrefsBot участвует в сборе данных о рейтинге, регулярно сканируя и индексируя страницы, чтобы определить их позицию в результатах поиска по определенным запросам. ключевые слова.

Недостатки Ahrefsbot

Вы должны знать о недостатках AhrefsBot. Каждый из них может вызвать нежелательные проблемы на вашем веб-сайте и, возможно, не стоит риска.

1. AhrefsBot может замедлить работу вашего сайта

Когда Ahrefsbot сканирует ваш сайт, он загружается так же, как и любой другой пользователь, потребляя трафик. Если Ahrefsbot сканирует ваш сайт слишком часто, он может потреблять слишком много трафика, что замедлит загрузку сайта для других посетителей.

Скорость — важнейший фактор ранжирования Google, который может негативно повлиять на пользовательский опыт.

2. AhrefsBot может быть использован спамерами

Как владельцы веб-сайтов, мы должны знать о спамерах. Нет ничего хуже, чем поток незваного реферального спам-трафика, который засоряет ваш отчет Google Analytics и влияет на производительность вашего сайта.

Спамеры могут использовать пользовательский агент Ahrefsbot для:

  • Неоднократно рассылайте спам на свой сайт.
  • Рассылайте фальшивый реферальный трафик.
  • Сотрите важные данные.

Если вы получаете много трафика от Ahrefsbot, вам следует изучить и сравнить его с официальными диапазонами IP-адресов Ahrefs.

Как управлять Ahrefsbot на вашем сайте?

управлять

AhrefsBot можно заблокировать или ограничить с помощью файла robots.txt или .htaccess. 

Способ 1: заблокировать Ahrefsbot с помощью файла Robots.txt

Ahrefs заявляет, что Ahrefsbot следует рекомендациям robots.txt. Вы можете заблокировать Ahrefsbot, добавив новые правила в файл robots.txt.

Здесь у вас есть два варианта:

  • Измените частоту, с которой AhrefsBot может посещать ваш сайт.
  • Полностью запретите AhrefsBot просматривать ваш сайт. 

Чтобы настроить частоту посещения Ahrefsbot вашего сайта, добавьте следующий код в файл robots.txt:

Значение задержки сканирования представляет собой время, в течение которого задержка была записана в секундах. Установите это значение, чтобы задерживать количество секунд между каждым сканированием Ahrefsbot.

Хотите полностью заблокировать Ahrefsbot?

Для этого добавьте тег запрета в файл robots.txt. Используйте следующий атрибут:

Ahrefsbot должен следовать правилу robots.txt, которое вы только что установили.

Способ 2. Заблокируйте AhrefsBot с помощью файла .htaccess.

Эта стратегия довольно хороша для блокировки AhrefsBot и дает вам больше контроля.

В отличие от подхода 1, который полагается на то, что Ahrefsbot будет следовать установленным вами правилам, метод 2 дает вам полный контроль над сервером.

Вы добавите диапазон IP-адресов Ahrefsbot и заблокируете его на основе этих адресов.

Теперь возникает вопрос…

Стоит ли блокировать Ahrefsbot?

Прежде чем использовать термин «блок», проанализируйте его плюсы и минусы:

If

  • Блокировка Ahrefsbot экономит ресурсы сервера и может улучшить производительность страницы.
  • Если вы обеспокоены раскрытием конфиденциальных данных, блокировка может помочь. 

Тогда, возможно, будет целесообразно заблокировать его.

If

  • Блокировка Ahrefsbot может лишить вас доступа к анализу обратных ссылок, конкурентным исследованиям и данным по ключевым словам.
  • Инструменты Ahrefs основаны на данных Ahrefsbot; его отключение может снизить видимость вашего сайта в отчетах и ​​рейтингах. 

Затем не блокируйте Ahrefsbot, так как вы хотите, чтобы ваш сайт обновлялся в индексе Ahrefs.

Наконец, этот вопрос может помочь вам решить, использовать ли Ahrefsbot. 

«Приносит ли это пользу моему сайту или вредит?»

Вы можете выяснить это, только просмотрев записи доступа к вашему сайту.

AhrefsBot против других SEO-сканеров (SemrushBot, Moz и т. д.)

AhrefsBot — не единственный SEO-бот, посещающий ваш сайт. Другие популярные SEO-инструменты, такие как Semrush, Млн. унций и Кричать Frog Также запускают ботов для сбора данных. Вот как AhrefsBot выглядит в сравнении с ними по поведению и использованию:

Имя ботаПример пользовательского агентаЦельЧастота сканированияУважаете robots.txt?
AhrefsBotAhrefsBot/7.0 (+http://ahrefs.com/robot/)Сбор обратных ссылок и SEO-данныхВысокийДа
СемрушБотMozilla/5.0 (compatible; SemrushBot/7~bl; +http://www.semrush.com/bot.html)SEO-аудиты, данные по ключевым словамСредне-высокаяДа
RogerBot от Mozrogerbot/1.0 (http://moz.com/help/pro/what-is-rogerbot)Метрики ссылок, индекс MozСреднийДа
Кричать Frog SEO паукПользовательский агент (может быть установлен пользователем)Аудит сайта по требованиюКонтролируется пользователемДа

Ключевые отличия:

  • AhrefsBot один из самых агрессивных роботов с точки зрения частоты, особенно если на вашем сайте есть обратные ссылки или он отслеживается через проекты Ahrefs.
  • СемрушБот и RogerBot от Moz более умеренны и обычно связаны с аудитами, инициированными пользователями, или периодическими обновлениями индекса.
  • Кричать Frog не сканирует ваш сайт, если кто-то не использует инструмент вручную — он не автоматизирован, как другие.

Если вы столкнулись с высоким уровнем трафика от ботов, стоит определить, какие SEO-боты атакуют ваш сервер, и решить, приносят ли они пользу или их необходимо заблокировать.

Совет: используйте журналы сервера или такие инструменты, как аналитика Cloudflare, чтобы отслеживать частоту посещений каждого бота и страницы, которые он посещает.

Заключение

Теперь у нас есть выбор: относиться к Ahrefsbot как к врагу, которого нужно победить, или как к другу, которого нужно подчинить. Понимание истинной природы Ahrefsbot и применение правильных мер позволит нам раскрыть его потенциал, одновременно снижая любые скрытые риски.

Мы можем превратить его из опасного врага в верного друга, доведя наши сайты до вершин достижений. 

Не забудьте ознакомиться с нашими последними публикациями в блоге:

FAQ

Что такое AhrefsBot?

Ahrefsbot — это веб-сканер, используемый Ahrefs, известным набором инструментов и сервисов SEO. Он систематически просматривает и индексирует веб-страницы, собирая информацию для множества инструментов SEO-анализа и отчетности Ahrefs.

Полезен или вреден Ahrefsbot для моего сайта?

В зависимости от того, как вы управляете присутствием Ahrefsbot на своем сайте, это может быть ваш друг или враг. Его навыки сканирования и сбора данных могут предоставить важную информацию для SEO, что делает его ценным союзником. Однако неуправляемая активность может истощить ресурсы сервера или раскрыть уязвимости, что делает ее потенциальным риском.

Как я могу увидеть активность AhrefsBot на моем сайте?

Думайте о Ahrefsbot как о добром посетителе, который оставляет визитную карточку при каждом посещении. Вот как выяснить его активность:

Строка пользовательского агента: Когда Ahrefsbot посещает ваш сайт, в журналах сервера сохраняется уникальная «строка пользовательского агента». Найдите следующую подпись: AhrefsBot/7.0; +http://ahrefs.com/robot/

Анализ журнала: Изучите журналы вашего сервера, чтобы определить поведение Ahrefsbot. Найдите его IP-адреса (которые время от времени меняются; обновления см. в официальной документации Ahrefs) и точные страницы, которые он просканировал.

Как заблокировать AhrefsBot от сканирования моего сайта?

Чтобы заблокировать AhrefsBot, добавьте следующие строки в свой robots.txt файл:

User-agent: AhrefsBot
Disallow: /

– Это дает боту указание не сканировать никакие страницы на вашем сайте.

Может ли блокировка AhrefsBot повлиять на мое SEO?

Блокировка AhrefsBot не повлияет напрямую на ваш рейтинг в Google, но может помешать пользователям Ahrefs, включая SEO-специалистов и маркетологов, просматривать ваш профиль обратных ссылок и данные по ключевым словам. Это может снизить видимость вашего сайта в инструментах конкурентного анализа.

Как узнать, сканирует ли AhrefsBot мой сайт?

Вы можете проверить журналы сервера на наличие следующего user-agent:

Mozilla / 5.0 (совместимо; AhrefsBot / 7.0; + http: //ahrefs.com/robot/)

Кроме того, вы можете фильтровать трафик по user-agent или IP-адресу бота, используя Cloudflare, Jetpack или другие аналитические платформы.

Какие IP-адреса использует AhrefsBot?

AhrefsBot использует набор IP-адресов, принадлежащих Ahrefs. Если вы не уверены в легитимности сканирования, воспользуйтесь их инструментом проверки IP-адресов.

Подпишитесь на нашу рассылку, чтобы получать последние обновления напрямую

Оставьте комментарий

Ваш электронный адрес не будет опубликован. Обязательные поля помечены * *