XML Sitemap помогает роботам поисковых систем ориентироваться в структуре и страницах сайта. Некорректно составленная карта может привести к проблемам с индексированием. Наш инструмент анализирует Sitemap: проверяет валидность, находит ошибки.
Для чего используют валидатор Sitemap
Карта сайта содержит важную для поисковиков информацию:
список всех URL;
общая структура, иерархия, приоритетность;
информация о проиндексированных картинках и видеодокументах.
Сервис «Анализ XML-карты сайта» анализирует корректность составления Sitemap, находит ошибки, проверяет количество ссылок, проиндексированных страниц и изображений, размер файла. Отдельная опция — проверка кода ответа каждого документа.
Вариативность онлайн-проверки
Для удобства можно менять настройки, для этого нужно отметить нужные опции:
Инструмент позволяет указать URL для анализа или загрузить файл.
При необходимости валидатор анализирует коды ответа указанных URL.
Можно скачать результаты в виде CSV-файла.
Как пользоваться инструментом
Если карта уже загружена на сайт, укажите ссылку. Если нет, передвиньте переключатель и загрузите файл в сервис.
Отметьте нужные опции: анализ кодов ответа сервера, скачивание результатов.
Нажмите на кнопку «Анализировать».
Анализ выполняется в фоне, проверка может продолжаться несколько минут.
Если карта сайта содержит ошибки, сервис указывает на них. А также показывает, какие URL отдают некорректный ответ. Эта информация помогает настроить Sitemap так, чтобы она ускоряла индексацию, способствовала SEO-продвижению сайта, росту поискового трафика.
Результаты проверок сохраняются в сервисе.
Инструмент работает на PRO-тарифах. Можно запускать до 5 параллельных проверок. За проверку списываются лимиты: 25 лимитов за каждую анализируемую XML карту. Опция «Анализировать коды ответа указанных URL» — 1 лимит за каждый URL из XML Sitemap.
Преимущества сервиса
Быстро и точно проверяет корректность Sitemap.
Проводит более подробный анализ, чем Яндекс.Вебмастер: проверяет наличие ошибок, размер файла, количество ссылок, считает документы в Яндексе и Google.
Анализирует коды ответа сервера, находит коды, отличные от 200.
Сохраняет предыдущие результаты проверки карты.
Инструмент полезен вебмастерам и SEO-специалистам при настройке нового или действующего сайта. Проверить карту необходимо при проблемах с индексацией сайта. Это обязательная часть технического аудита.
-
sitemap-xml.ru
- »
-
Сервисы
- »
-
Проверка актуальности sitemap.xml
Сервис позволяет проверить наличие и актуальность страниц в файле sitemap.xml.
Путь до файла sitemap.xml
Проверка
Обработано страниц: 0 из 0
Остановить
Готово
Страниц в файле: 0
Существующие страницы: 0
Несуществующие страницы: 0
Редиректы: 0
Запрещены в robots.txt: 0
Запрещены тегом meta: 0
Скачать отчет
Остановлено
Файл sitemap.xml используется поисковыми системами для быстрого получения информации о всех страницах сайта, для этого он должен быть актуальным.
Часто владельцы сайта сами генерируют карту сайта онлайн и не заботятся об изменениях количества страниц. В этом случае роботы поисковых систем находят несуществующие страницы или не находят нужных.
Сервис позволяет проверить актуальность всех страниц в файле и формирует отчет.
Ошибка
Sitemap.xml — это карта сайта для поисковых роботов, которая находится в корне сайта и содержит рекомендации того, какие страницы необходимо обходить в первую очередь и с какой частотой. Это ускоряет и упрощает процесс индексации. Создание sitemap.xml не является обязательным правилом. Такая карта должна быть на сайтах, которые имеют большое количество страниц, и в тех случаях, когда контент на страницах часто обновляется.
Sitemap, как правило, формирует программное обеспечение сайта по всем страницам, которые на нем есть. Однако не все системы администрирования сайтов знают, какие страницы запрещены для индексирования директивами в robots.txt или другим способом, и поэтому в Sitemap попадают закрытые от индексации страницы, а также страницы, созданные, но не добавленные в меню и т. д. Эти ошибки приносят массу проблем с поисковыми системами.
Разные поисковые системы обрабатывают правила в sitemap по-разному. Например, Яндекс скорей всего проиндексирует все страницы, которые есть в sitemap. Google чаще всего индексирует только те страницы, до которых можно дойти краулером переходом по ссылкам на сайте с учетом всех правил. То есть Google использует sitemap только для определения частоты сканирования страниц, а Яндекс берёт из sitemap страницы для индексации. Это является одной из причин, почему число страниц в Яндекс и Google может отличаться.
Анализ sitemap на сервисе Labrika помогает найти следующие виды ошибок:
Есть в sitemap, но не найдены при обходе сайта
Содержание отчета:
- Адреса страниц.
- Код ответа страницы. Ошибка 404 — это стандартный код ответа HTTP о том, что страница не может быть найдена.
- Количество входящих ссылок, ведущих на страницу.
- Наличие блокировки страницы от индексации при помощи атрибута noindex.
- Наличие блокировки ссылок на страницу при помощи атрибута nofollow.
- Наличие блокировки страницы от индексации в Яндексе посредством директивы в robots.txt.
- Наличие блокировки страницы от индексации в Google посредством директивы в robots.txt.
- После нажатия кнопки «Скачать исправленный sitemap.xml» Labrika самостоятельно исправит все обнаруженные ошибки и сохранит правильную обновленную версию sitemap.xml на ваш компьютер.
Этот отчёт помогает найти так называемые страницы-сироты. Про этот термин в России знают далеко не все оптимизаторы. На Западе же он широко используется.
Страницы-сироты (бесхозные страницы) — это страницы веб-сайта, на которые нет ссылок с других страниц вашего сайта. Если такая страница даже проиндексируется поисковой системой, то PageRank (ссылочный вес) у этих страниц будет равен нулю, а значит позиции по конкурентным запросам будут сильно занижены. B интернете можно найти исследования, которые указывают на то, что несмотря на отказ от расчёта PageRank на сайт поисковые системы используют PageRank или аналогичные алгоритмы для оценки веса страниц внутри сайта. А это значит, что если посадочная страница попала в этот отчёт, то это требует срочного исправления ошибок.
Причины ошибки могут быть следующие:
- На страницу ведет ссылка с документа, который сам закрыт для индексации, либо закрыты ведущие на него страницы. В результате паук поисковой системы, передвигаясь от главной страницы, доходит до закрытых страниц и не может пройти дальше, чтобы проиндексировать следующие документы.
- Заблокированы ссылки на нужную страницу, например, через атрибут
rel=nofollow
. То есть паук видит ссылку на страницу, но не переходит по ней, так как это запрещено. - На страницу нет и, возможно, никогда не было ссылок.
- Страницу удалили в редакторе сайта и из меню, а html-файл на сайте остался.
- Закрыта сама страница, которая есть в sitemap. Поэтому она и не была найдена при индексации.
Чтобы исправить ошибку необходимо проверить блокировки страниц и ссылок на более низких уровнях, начиная с главной страницы сайта. Чаще всего ошибка возникает из-за того, что страницу сделали, но не добавили в меню или из-за того, что закрыли от индексации пагинацию в каталоге товаров (или в разделе блога – для информационных страниц).
Есть в sitemap, но закрыты от индексации
Здесь отображаются страницы, которые запрещены для индексации, но есть в sitemap.
То есть страницы по каким-то причинам закрыли от индексации, но не убрали из sitemap.
Это может привести к утечке конфиденциальной информации, появлению закрытых от индексации дублей страниц в индексе поисковых систем (+снижение позиций из-за этого) или потере краулингового бюджета в Яндексе. Google, как правило, не индексирует такие страницы. Их следует удалить из карты сайта. Если же по ошибке оказалась закрыта от индексирования страница, которая должна попасть в результаты поиска, необходимо снять блокировку индексации.
Нет в sitemap, но разрешены для индексации
Содержание отчета:
- Адреса страниц.
- Код ответа страницы. Код 200 говорит об успешной обработке запроса (страница доступна).
- Количество входящих ссылок, ведущих на страницу.
- После нажатия кнопки «Скачать исправленный sitemap.xml» Labrika самостоятельно исправит все обнаруженные ошибки и сохранит правильную версию карты сайта на ваш компьютер.
Здесь отображаются страницы, которые разрешены для индексации, но отсутствуют в sitemap. Эта ошибка самая безобидная из всех. Тем не менее, наличие страницы в sitemap даёт возможность управлять краулинговым бюджетом. Краулинговый бюджет — это лимит страниц, который поисковый робот может просканировать за определенный период времени. Важно, чтобы он расходовался на приоритетные посадочные страницы. Для этого они должны быть прописаны в sitemap.
В случае появления данной ошибки добавьте нужные страницы в карту сайта, а также проверьте, включено ли её автоматическое обновление и все ли необходимые разделы обрабатываются при формировании sitemap.
Внимание! Отчёты по sitemap будут доступны в том случае, если было выставлено достаточно лимитов, чтобы просканировать весь сайт. Иначе Labrika только определит, какие страницы включены в карту сайта, но не сможет установить весь список существующих на сайте страниц и сравнить его с содержимым sitemap.