Sitemap.xml: как создать и для чего нужна карта сайта

Sitemap.xml: как создать и для чего нужна карта сайта

Что такое карта сайта sitemap.xml

XML-карта сайта — файл с информацией для поисковых систем о тех страницах, которые требуется проиндексировать. Другими словами, карта сайта — полный перечень всех страниц в формате XML, которые открыты для сканирования поисковым роботом. Анализ карты сайта позволяет выяснить, почему не индексируется тот или иной контент. Задача sitemap — предоставить поисковикам доступ к содержимому сайта.

Также существуют карты сайта для живых посетителей. Их еще называют HTML-картами. Это каталоги страниц сайта с отображением иерархии. HTML-карта помогает посетителям путешествовать по сайту и легко находить нужные страницы.

XML и HTML – языки разметки.

HTML-карты – уже устаревший и не самый удобный элемент навигации. Сосредоточимся на XML-картах, которые необходимы для правильной индексации страниц сайта.

Зачем нужна карта сайта sitemap.xml

Подробно о том, зачем необходимы карты сайтов sitemap.xml, можно прочитать в справочниках от Google и «Яндекса». Если сказать вкратце, в sitemap.xml хранится важная для поисковых роботов информация. Это:

  1. Список URL страниц сайта, а также их иерархия.
  2. Тип опубликованного контента, например, изображения или видео.
  3. Информация об изображениях и видео, которые поисковики используют для индексирования сайта и формирования выдачи.
  4. Информация о частоте обновления и последнем обновлении конкретной страницы.
  5. Сведения о приоритетности страницы.
  6. Данные об альтернативных версиях страницы.
Иными словами, карта сайта – навигатор для поисковых систем.

XML-карта и краулинговый бюджет

Краулер (паук) — это поисковый робот, который сканирует страницы сайта и добавляет их в индекс. Краулинговый бюджет — это то количество страниц, которое робот посещает за один раз. Важно учитывать, что для разных сайтов этот бюджет отличается — это может быть несколько десятков или сотен документов. Именно поэтому важно направить краулера по тем страницам, которые имеют значение при продвижении сайта, при этом сделав все необходимое, чтобы он не добрался до некачественных, малоинформативных, а также служебных страниц.

Отсутствие файла sitemap не является серьезной ошибкой. Однако если поисковый бот не найдет файл sitemap.xml, он будет сканировать и добавлять в индекс документы по своему усмотрению, и в таком случае наличие «мусорных», служебных страниц, дублей, страниц с ошибкой 404 в индексе будет существенным препятствием к выходу сайта в топ.

Роботы всех поисковых систем способны самостоятельно обнаружить XML-карту сайта, если она размещена по url-адресу site.com/sitemap.xml, но есть определенные способы донести до поисковиков важную информацию быстрее.

Можно ли обойтись без sitemap.xml

Можно. Поисковые системы считают XML-карту рекомендованным инструментом, но не обязательным. Например, если на сайте нет sitemap.xml, «Яндекс» будет отмечать это в списке возможных, а не критичных или фатальных проблем.

Роботы вполне способны проиндексировать сайт и без sitemap.xml. Но в некоторых ситуациях отсутствие XML-карты может привести к проблемам с индексированием. Пример:

  1. На сайте есть страницы, на которые нет ссылок с иных страниц сайта.
  2. Сайт очень большой, у него сложная структура.
  3. Сайт новый.
  4. Многие страницы часто обновляются.
  5. Страницы сайта можно разделить на более и менее важные.
Рекомендация: если у вас коммерческий сайт, от посещаемости которого напрямую зависит успех бизнеса, обязательно создайте и подключите sitemap.xml. Ниже будет подробно описано, как это сделать.

Спецпредложение! Бесплатный аудит вашего сайта.

Заполните заявку и получите от меня бесплатный аудит на 3 000 руб. вашего сайта с планом работы на 3 месяца.

Отличие XML-карты сайта от HTML

Под термином «карта сайта», как мы говорили ранее, понимают 2 вида документов:

  1. HTML (веб-страница) — перечень ссылок на имеющиеся страницы сайта. Нужна преимущественно для навигации пользователей, как правило, оформлена как древовидная структура, имеет адрес вида site.com/sitemap/ или site.com/karta-saita/ и т.п.
  2. XML — файл в корневой папке сайта, который включает список URL с информацией об их последнем обновлении и приоритете в индексировании. Необходим для поисковых роботов и обязательно должен быть доступен по адресу site.com/sitemap.xml.

Синтаксис sitemap.xml

Первой строкой в файле sitemap указывается ссылка на пространство имен языка XML (описание стандарта, на основе которого составлен файл). Строка всегда стандартная и выглядит таким образом:

<urlset xmlns="<a href=" http:="" www.sitemaps.org=&quot;&quot; schemas="" sitemap="" 0.9"=""></urlset><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt;&lt;/urlset&gt;&lt;urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt;&lt;/urlset&gt;&lt;urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt;

Первая строка

XML-карта сайта должна иметь кодировку UTF-8 и содержать такие теги:

  • <urlset> — открывающий/закрывающий тег, в который заключаются все ссылки файла sitemap, указывает стандарт текущего протокола;

Тег urlset
  • <url> — содержит в себе всю необходимую для робота информацию о каждой ссылке: URL, с какой периодичностью обновляется информация по этому адресу, дату последнего обновления и приоритет в индексировании;

Тег url
  • <loc> — ограничивает конкретный URL;

Тег loc
  • <changefreq> — задает частоту обновления информации на странице: always, hourly, daily, weekly, monthly, yearly, never (всегда, ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно, никогда). Благодаря этому тегу робот может определить, насколько часто меняется содержание в документе и нужно ли его сканировать чаще. Тег необязателен и сейчас используется очень редко.

Тег changefreq
  • <lastmod> — указывает на дату последнего обновления страницы. Так робот определяет, изменилось ли что-нибудь с момента его предыдущего посещения.

Тег lastmod
  • <priority> — дает роботам рекомендацию о приоритете индексирования. Главная страница всегда имеет <priority> 1, а остальные можно расставить самостоятельно в зависимости от предпочтений оптимизатора (например, 0,8, 0,6 и так далее до 0,1).

Тег priority

Рекомендация по количеству ссылок в файле sitemap.xml — не более 50 тысяч. Если количество страниц сайта больше, стоит сделать несколько карт, а в начале файла site.com/sitemap.xml указать на них ссылки.

Как создать файл sitemap.xml

Создать карту сайта можно двумя способами. Первый – сделать sitemap.xml можно с помощью внешнего онлайн-генератора. Второй – потребуется модуль или внутренний генератор для конкретной CMS. Рассмотрим оба способа.

Требования к файлу

  1. У Яндекса возможна поддержка карты сайта только в XML-формате.
  2. Кодировка файла должна быть UTF-8.
  3. Файл не должен превышать 50 мегабайт.
  4. Он должен содержать не более 50000 страниц.
  5. Файлов может быть несколько: если не удается уложиться в лимит на 50000 страниц, то стоит создать дополнительные карты. Ссылки на них указываются в основном файле

Как создать карту сайта с помощью онлайн-генераторов

Этот способ хорош тем, что вам не приходится привязываться к определенному движку. С помощью онлайн-генераторов можно сделать sitemap.xml для сайта на любой CMS или для статичного сайта на HTML.

У этого способа есть минус. Он подходит лишь для сайтов с ограниченным количеством страниц, например, для сайтов-визиток. Если на сайте пять страниц, а новые создавать не планируется, сделать sitemap.xml можно один раз с помощью бесплатного внешнего сервиса.

Если на сайте регулярно появляются новые страницы, бесплатные внешние программы для генерации не подойдут. Они не включают в карту сайта новые URL, поэтому sitemap.xml теряет актуальность.

Вот несколько генераторов карты сайта:

https://www.xml-sitemaps.com/
http://www.mysitemapgenerator.com/ru/
https://xmlsitemapgenerator.org/
http://www.web-site-map.com/

Следует указать главную страницу и запустите процесс. Полученный файл можно загрузить на сервер, в корневую директорию на сайте. Это делают с помощью FTP-клиента или файлового менеджера используемого хостинга

Генерация sitemap.xml при помощи паука Screaming Frog

Карту сайта можно получить из выгрузки пауком Screaming Frog SEO Spider. После парсинга страниц сайта удастся получить необходимый список страниц. В пауке есть функция генерации карты сайта в XML формате на основе полученных данных.

Единственный минус такого подхода: отсутствие автоматизированного генерирования карты, т.е. при добавлении новых страниц на сайт потребуется вносить ссылки на них вручную. В идеале CMS вашего сайта должна добавлять каждую новую страницу в xml файл автоматически.

Подробнее про паука и сам процесс генерации карты вы можете прочитать в другой статье.

ИНТЕРНЕТ-МАРКЕТИНГ
РАЗРАБОТКА САЙТОВ
SEO продвижение

Как создать sitemap.xml при помощи CMS

Этот способ создания карты сайта удобнее по сравнению с бесплатными онлайн-генераторами. Он обеспечивает дополнительную гибкость: вебмастер может управлять параметрами sitemap.xml. Кроме этого, надстройки автоматически обновляют карту сайта после создания новых страниц и уведомляют об этом поисковые системы.

Если ваш сайт работает на WordPress, обратите внимание на следующие популярные плагины, которые можно просто установить:

  • Google XML Sitemaps;
  • Yoast SEO.

Это не единственные плагины для WP, с помощью которого создаются карты сайта. Например, в комбайне All in One SEO есть модуль «Sitemaps».

Функция создания Sitemap в WP через плагин All in ONE SEO

Встроенная в 1C-Битрикс функция

Настройка sitemap.xml доступна в разделе «Маркетинг» административной панели.

Переход к настройкам карты

Добавьте файл, назовите его, а затем активируйте чекбокс о добавлении ссылки в robots.txt.

Добавьте имя и разрешение на запись в роботс

Во вкладке «Файлы» выберите разделы, которые необходимо предоставить для индексации поисковым роботам:

Определите разделы, которые надо индексировать

То же самое делается во вкладке «Инфоблоки».

Сохраните все изменения и нажмите кнопку «Запустить»:

Завершение настройки

Модули для других CMS

  1. Joomla: используйте плагины OSMap (бесплатная версия Free и платная Pro), jSitemap (платное расширение, но предлагает целый набор SEO-инструментов).
  2. Drupal: модуль XML Sitemap.
  3. Magento: настройте Site Map Configuration.

Выбирайте подходящий способ создания XML-карты сайта и оставляйте указания поисковым роботам, какие страницы им необходимо посетить — это позволит быть уверенным, что поисковый робот проиндексирует все необходимые страницы вовремя.

Как рассказать поисковым роботам про xml карту

Как добавить карту в Google Search Console и «Яндекс.Вебмастер»

Добавить файл sitemap.xml в разделы «Индексирование — Файлы Sitemap» Яндекс.Вебмастера и «Файлы Sitemap» в Google Search Console.

Добавление карты в Вебмастер

Добавление карты в Google Search Console

Яндекс и Google не только проверят добавленный файл, но и в результатах проверки укажут на возможные ошибки.

Указать в robots.txt:

Указать ссылку на файл в директиве sitemap файла robots.txt:

Указываем ссылку на карту в файле роботс.

Подробнее о robots.txt читайте в другой статье сайта

Как использование sitemap.xml влияет на SEO

Само по себе отсутствие файла sitemap.xml не будет считаться главной причиной для понижения сайта в выдаче поиска. Однако важно учитывать тот факт, что поисковый робот в некоторых случаях может не увидеть отдельные страницы сайта, особенно если он имеет тысячи страниц.

Карта сайта sitemap дает возможность ускорить время индексации страниц, а это благоприятно влияет на определение первоисточника документа, что важно в случае, когда кто-то из конкурентов захочет скопировать, например, статью.

Важно в карту сайта включать лишь те страницы, которые робот должен проиндексировать. Обязательно исключите из него все технические страницы (в robots.txt), не предназначенные для индексации поисковыми системами, поскольку это может отрицательно сказаться на оптимизации и продвижении сайта.

Автор

Артём Опарин

Артём Опарин

ИНТЕРНЕТ-МАРКЕТОЛОГ С ОПЫТОМ БОЛЕЕ 10 ЛЕТ.

Подписывайтесь в соцсетях:

Комментарии

Вам также может понравиться

Ошибка 429: выявляем источник проблемы и находим эффективные пути решения
24 марта 2025
631
Ошибка 429: выявляем источник проблемы и находим эффективные пути решения
Ошибка 429 Too Many Requests является распространенной проблемой, с которой нередко сталкиваются веб-разработчики, администраторы сайтов и даже обычные пользователи интернета. Эта ошибка HTTP-стат...
Читать
Мощь исходящих ссылок: стратегии линкбилдинга для роста в поисковой выдаче
7 февраля 2025
614
Мощь исходящих ссылок: стратегии линкбилдинга для роста в поисковой выдаче
Внешние ссылки являются неотъемлемой частью успешной SEO-стратегии для любого веб-ресурса. Они представляют собой гиперссылки, ведущие со сторонних сайтов на страницы вашего веб-сайта. Наличие кач...
Читать
Повышаем конверсию с SEO-текстами: советы для авторов и оптимизаторов
31 октября 2024
454
Повышаем конверсию с SEO-текстами: советы для авторов и оптимизаторов
В современном цифровом мире успех любого интернет-ресурса напрямую зависит от грамотного SEO-продвижения. Создание качественного, оптимизированного под поисковые системы контента является одним из...
Читать
SKU: ключевой инструмент оптимизации торговли и управления ассортиментом
4 октября 2024
608
SKU: ключевой инструмент оптимизации торговли и управления ассортиментом
SKU, или Stock Keeping Unit, стал неотъемлемой частью современного бизнеса, особенно в сфере розничной торговли и управления запасами. Этот уникальный идентификатор играет ключевую роль в оптимиза...
Читать
Технический SEO-аудит: главные направления для анализа качества сайта
19 апреля 2022
1579
Технический SEO-аудит: главные направления для анализа качества сайта
Как и когда проводят СЕО-аудит СЕО-аудит – процедура, в ходе которой проверяют, насколько ресурс отвечает требованиям поисковиков. По результатам проверки сайт должен стать понятным для поисковых...
Читать
Что такое целевая аудитория, как ее определить и сегментировать
9 февраля 2023
2575
Что такое целевая аудитория, как ее определить и сегментировать
Что такое целевая аудитория Целевая аудитория — это группа людей, которые являются основными потенциальными клиентами компании и могут заказать продукт или услугу. Определять целевую аудиторию ва...
Читать
Что такое Figma: полное руководство по использованию облачного редактора для командного дизайна
10 сентября 2024
617
Что такое Figma: полное руководство по использованию облачного редактора для командного дизайна
На современном этапе развития цифровых технологий дизайн становится неотъемлемой частью многих проектов - будь то создание веб-сайтов, мобильных приложений или проектирование пользовательских инте...
Читать
Удаление негативных отзывов в интернете: профессиональный подход
16 мая 2024
622
Удаление негативных отзывов в интернете: профессиональный подход
Негативные отзывы в интернете способны нанести серьезный урон репутации любого бренда или компании. В эпоху социальных сетей и свободного обмена информацией недовольные клиенты получают мощный инс...
Читать
Что такое дипфейк: как создать и зачем использовать в рекламе
8 ноября 2024
475
Что такое дипфейк: как создать и зачем использовать в рекламе
Дипфейк (англ. deepfake, сокращение от deep learning и fake - "глубокое обучение" и "подделка") - это метод синтеза аудиовизуального контента с применением технологий искусственного интеллекта и м...
Читать
Апдейты поисковых систем: угрозы и возможности для вашего бизнеса
16 сентября 2024
456
Апдейты поисковых систем: угрозы и возможности для вашего бизнеса
Апдейты в поисковых системах являются неотъемлемой частью процесса постоянного совершенствования поисковой выдачи. Они представляют собой регулярные обновления баз данных и алгоритмов ранжирования...
Читать
Асессоры Яндекса и Google: профессия будущего в эпоху ИИ
4 октября 2024
522
Асессоры Яндекса и Google: профессия будущего в эпоху ИИ
Современный интернет изобилует огромным количеством информации на абсолютно любую тему. Пользователи ежедневно вводят миллионы поисковых запросов, стремясь найти актуальные и достоверные данные. Н...
Читать
Маскоты в веб-дизайне: Как персонажи бренда усиливают маркетинг и улучшают пользовательский опыт
22 мая 2025
340
Маскоты в веб-дизайне: Как персонажи бренда усиливают маркетинг и улучшают пользовательский опыт
Маскот на сайте или в мобильном приложении – это не просто визуальный элемент, но и мощный маркетинговый инструмент. В последние годы маскоты приобрели популярность среди брендов, стремящихся повы...
Читать
Словарь для карьерного роста: разбираем C-level от А до Я
6 августа 2024
531
Словарь для карьерного роста: разбираем C-level от А до Я
На современном этапе развития бизнеса наблюдается стремительный рост популярности использования англоязычных аббревиатур для обозначения высших руководящих должностей в компаниях. Термины вроде CE...
Читать
Разбираем маркетплейсы: просто о главном для продавцов и покупателей
25 июня 2024
610
Разбираем маркетплейсы: просто о главном для продавцов и покупателей
Маркетплейс - это онлайн-платформа или торговая площадка, где продавцы размещают свои товары, а покупатели могут выбирать нужные предложения по ценам, характеристикам и другим параметрам. Простыми...
Читать
Траст сайта: как заслужить доверие Google и Яндекса
2 июня 2025
148
Траст сайта: как заслужить доверие Google и Яндекса
В эпоху цифровой конкуренции и информационного шума завоевание высоких позиций в поисковой выдаче стало задачей стратегического уровня для любого онлайн-проекта. SEO уже давно перестало быть прост...
Читать
Инфоповоды: универсальный инструмент маркетинга для роста компании
15 января 2025
456
Инфоповоды: универсальный инструмент маркетинга для роста компании
Инфоповод - это событие, новость или информация, которая привлекает внимание целевой аудитории и средств массовой информации. Это своего рода "информационный крючок", призванный заинтересовать люд...
Читать
Robots.TXT: полная инструкция по созданию, настройке и использованию директив под нужды SEO
21 марта 2022
7110
Robots.TXT: полная инструкция по созданию, настройке и использованию директив под нужды SEO
Что такое robots.txt Robots.txt — это стандартный текстовый файл в кодировке UTF-8 с расширением .txt, который содержит директивы и инструкции индексирования сайта, его страниц или разделов. Он н...
Читать
URL-адрес: путеводитель по созданию оптимальных веб-адресов
3 июля 2024
493
URL-адрес: путеводитель по созданию оптимальных веб-адресов
URL (Uniform Resource Locator) представляет собой уникальный унифицированный указатель ресурса, используемый для идентификации местоположения документа, изображения, веб-страницы или другого цифро...
Читать
Упрощение жизни с кластерами запросов
16 октября 2020
1155
Упрощение жизни с кластерами запросов
Настройка при работе первый раз с макросами При первом запуске макросов на ПК необходимо выполнить до настройки MS Excel Зайти в пункт меню файл Выбор Файл 2. Далее ...
Читать
Всё про показатель отказов: что такое, как уменьшить, где смотреть
23 сентября 2022
1255
Всё про показатель отказов: что такое, как уменьшить, где смотреть
Что такое показатель отказов Показатель отказов, Bounce Rate — это количество таких посещений сайта, когда посетитель сразу же покидает страницу. Как правило, такое значение используют для ...
Читать
Что такое поведенческие факторы и почему они важны для SEO в 2023 году
27 января 2023
1356
Что такое поведенческие факторы и почему они важны для SEO в 2023 году
Что такое поведенческие факторы ранжирования Поведенческими факторами называют комплекс метрик на аналитических платформах поисковых систем, которые применяются для оценки поведения пользо...
Читать
Решение проблем с Яндексом: секреты грамотного обращения в техподдержку
16 сентября 2024
380
Решение проблем с Яндексом: секреты грамотного обращения в техподдержку
Во время работы с различными сервисами Яндекса время от времени возникают проблемные ситуации, в которых сложно разобраться самостоятельно. Будь то неожиданные сбои, технические ошибки или непоним...
Читать
Ошибка 403 Forbidden: диагностика проблемы и способы ее устранения
8 июля 2024
933
Ошибка 403 Forbidden: диагностика проблемы и способы ее устранения
Ошибка 403 Forbidden - это код ответа HTTP-сервера, указывающий на то, что сервер понял запрос клиента, но отказался его выполнять из-за ограничений системы безопасности. Проще говоря, данная ошиб...
Читать
Метатег Description: пошаговое руководство по созданию эффективных описаний
4 февраля 2025
479
Метатег Description: пошаговое руководство по созданию эффективных описаний
Метатег Description является одним из ключевых элементов технической оптимизации сайта, играющим важную роль в продвижении веб-ресурса. Этот HTML-элемент представляет собой краткое описание содерж...
Читать
Диверсификация от А до Я: полное руководство для предпринимателей
13 августа 2024
1133
Диверсификация от А до Я: полное руководство для предпринимателей
Диверсификация - это распределение усилий и ресурсов между несколькими разными направлениями или видами деятельности. Главная цель диверсификации - снизить риски и минимизировать потери в случае н...
Читать
Секреты работы с сайтами-реципиентами для роста позиций и трафика из поисковых систем
25 декабря 2024
605
Секреты работы с сайтами-реципиентами для роста позиций и трафика из поисковых систем
В современном интернет-маркетинге ссылочное продвижение остается одним из ключевых факторов успешного SEO. Благодаря грамотному наращиванию ссылочной массы можно значительно повысить позиции сайта...
Читать
Термины SEO
25 октября 2021
2442
Термины SEO
Ассортиментная матрица или товарная матрица - это максимально полный, разделенный на категории и группы перечень всех товарных позиций определенной тематики. Базовая частотность - самая ...
Читать
Руководство по продвижению интернет-магазина: от SEO до рекламы и увеличения конверсии
30 мая 2025
214
Руководство по продвижению интернет-магазина: от SEO до рекламы и увеличения конверсии
Интернет-магазины стали неотъемлемой частью современной коммерции. В условиях высокой конкуренции и насыщенности рынка важно не только создать привлекательный сайт с удобной навигацией и ассортиме...
Читать
Разработка технического задания копирайтеру на примере
18 октября 2021
969
Разработка технического задания копирайтеру на примере
Как и обещал ранее в своей предыдущей статье, предлагаю пошаговый алгоритм, как написать Техническое задание (далее - ТЗ) для копирайтера с разбивкой по блокам. Повторяй за мной и ты сэкономишь св...
Читать
Профессия SEO-специалист: всё, что нужно знать
20 августа 2024
439
Профессия SEO-специалист: всё, что нужно знать
На сегодняшний день эффективное присутствие компании в интернете является критически важным для успеха бизнеса. По данным статистики, более 90% пользователей начинают поиск товаров и услуг именно ...
Читать
Графический дизайнер: путь к творческой самореализации и финансовому успеху
31 марта 2025
328
Графический дизайнер: путь к творческой самореализации и финансовому успеху
Графический дизайн является неотъемлемой частью современного мира визуальных коммуникаций. Повсюду, куда бы мы ни посмотрели, нас окружают различные элементы графического дизайна – логотипы брендо...
Читать
KPI - путь к максимальной производительности компании
7 июня 2024
569
KPI - путь к максимальной производительности компании
В современном динамичном бизнес-мире, где конкуренция обостряется с каждым днем, а требования клиентов растут, компаниям необходимо тщательно отслеживать свою эффективность и оперативно выявлять л...
Читать
смотреть все