Sitemap.xml: как создать и для чего нужна карта сайта

Sitemap.xml: как создать и для чего нужна карта сайта

Что такое карта сайта sitemap.xml

XML-карта сайта — файл с информацией для поисковых систем о тех страницах, которые требуется проиндексировать. Другими словами, карта сайта — полный перечень всех страниц в формате XML, которые открыты для сканирования поисковым роботом. Анализ карты сайта позволяет выяснить, почему не индексируется тот или иной контент. Задача sitemap — предоставить поисковикам доступ к содержимому сайта.

Также существуют карты сайта для живых посетителей. Их еще называют HTML-картами. Это каталоги страниц сайта с отображением иерархии. HTML-карта помогает посетителям путешествовать по сайту и легко находить нужные страницы.

XML и HTML – языки разметки.

HTML-карты – уже устаревший и не самый удобный элемент навигации. Сосредоточимся на XML-картах, которые необходимы для правильной индексации страниц сайта.

Зачем нужна карта сайта sitemap.xml

Подробно о том, зачем необходимы карты сайтов sitemap.xml, можно прочитать в справочниках от Google и «Яндекса». Если сказать вкратце, в sitemap.xml хранится важная для поисковых роботов информация. Это:

  1. Список URL страниц сайта, а также их иерархия.
  2. Тип опубликованного контента, например, изображения или видео.
  3. Информация об изображениях и видео, которые поисковики используют для индексирования сайта и формирования выдачи.
  4. Информация о частоте обновления и последнем обновлении конкретной страницы.
  5. Сведения о приоритетности страницы.
  6. Данные об альтернативных версиях страницы.
Иными словами, карта сайта – навигатор для поисковых систем.

XML-карта и краулинговый бюджет

Краулер (паук) — это поисковый робот, который сканирует страницы сайта и добавляет их в индекс. Краулинговый бюджет — это то количество страниц, которое робот посещает за один раз. Важно учитывать, что для разных сайтов этот бюджет отличается — это может быть несколько десятков или сотен документов. Именно поэтому важно направить краулера по тем страницам, которые имеют значение при продвижении сайта, при этом сделав все необходимое, чтобы он не добрался до некачественных, малоинформативных, а также служебных страниц.

Отсутствие файла sitemap не является серьезной ошибкой. Однако если поисковый бот не найдет файл sitemap.xml, он будет сканировать и добавлять в индекс документы по своему усмотрению, и в таком случае наличие «мусорных», служебных страниц, дублей, страниц с ошибкой 404 в индексе будет существенным препятствием к выходу сайта в топ.

Роботы всех поисковых систем способны самостоятельно обнаружить XML-карту сайта, если она размещена по url-адресу site.com/sitemap.xml, но есть определенные способы донести до поисковиков важную информацию быстрее.

Можно ли обойтись без sitemap.xml

Можно. Поисковые системы считают XML-карту рекомендованным инструментом, но не обязательным. Например, если на сайте нет sitemap.xml, «Яндекс» будет отмечать это в списке возможных, а не критичных или фатальных проблем.

Роботы вполне способны проиндексировать сайт и без sitemap.xml. Но в некоторых ситуациях отсутствие XML-карты может привести к проблемам с индексированием. Пример:

  1. На сайте есть страницы, на которые нет ссылок с иных страниц сайта.
  2. Сайт очень большой, у него сложная структура.
  3. Сайт новый.
  4. Многие страницы часто обновляются.
  5. Страницы сайта можно разделить на более и менее важные.
Рекомендация: если у вас коммерческий сайт, от посещаемости которого напрямую зависит успех бизнеса, обязательно создайте и подключите sitemap.xml. Ниже будет подробно описано, как это сделать.

Спецпредложение! Бесплатный аудит вашего сайта.

Заполните заявку и получите от меня бесплатный аудит на 3 000 руб. вашего сайта с планом работы на 3 месяца.

Отличие XML-карты сайта от HTML

Под термином «карта сайта», как мы говорили ранее, понимают 2 вида документов:

  1. HTML (веб-страница) — перечень ссылок на имеющиеся страницы сайта. Нужна преимущественно для навигации пользователей, как правило, оформлена как древовидная структура, имеет адрес вида site.com/sitemap/ или site.com/karta-saita/ и т.п.
  2. XML — файл в корневой папке сайта, который включает список URL с информацией об их последнем обновлении и приоритете в индексировании. Необходим для поисковых роботов и обязательно должен быть доступен по адресу site.com/sitemap.xml.

Синтаксис sitemap.xml

Первой строкой в файле sitemap указывается ссылка на пространство имен языка XML (описание стандарта, на основе которого составлен файл). Строка всегда стандартная и выглядит таким образом:

<urlset xmlns="<a href=" http:="" www.sitemaps.org=&quot;&quot; schemas="" sitemap="" 0.9"=""></urlset><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt;&lt;/urlset&gt;&lt;urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt;&lt;/urlset&gt;&lt;urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9&quot;&gt;

Первая строка

XML-карта сайта должна иметь кодировку UTF-8 и содержать такие теги:

  • <urlset> — открывающий/закрывающий тег, в который заключаются все ссылки файла sitemap, указывает стандарт текущего протокола;

Тег urlset
  • <url> — содержит в себе всю необходимую для робота информацию о каждой ссылке: URL, с какой периодичностью обновляется информация по этому адресу, дату последнего обновления и приоритет в индексировании;

Тег url
  • <loc> — ограничивает конкретный URL;

Тег loc
  • <changefreq> — задает частоту обновления информации на странице: always, hourly, daily, weekly, monthly, yearly, never (всегда, ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно, никогда). Благодаря этому тегу робот может определить, насколько часто меняется содержание в документе и нужно ли его сканировать чаще. Тег необязателен и сейчас используется очень редко.

Тег changefreq
  • <lastmod> — указывает на дату последнего обновления страницы. Так робот определяет, изменилось ли что-нибудь с момента его предыдущего посещения.

Тег lastmod
  • <priority> — дает роботам рекомендацию о приоритете индексирования. Главная страница всегда имеет <priority> 1, а остальные можно расставить самостоятельно в зависимости от предпочтений оптимизатора (например, 0,8, 0,6 и так далее до 0,1).

Тег priority

Рекомендация по количеству ссылок в файле sitemap.xml — не более 50 тысяч. Если количество страниц сайта больше, стоит сделать несколько карт, а в начале файла site.com/sitemap.xml указать на них ссылки.

Как создать файл sitemap.xml

Создать карту сайта можно двумя способами. Первый – сделать sitemap.xml можно с помощью внешнего онлайн-генератора. Второй – потребуется модуль или внутренний генератор для конкретной CMS. Рассмотрим оба способа.

Требования к файлу

  1. У Яндекса возможна поддержка карты сайта только в XML-формате.
  2. Кодировка файла должна быть UTF-8.
  3. Файл не должен превышать 50 мегабайт.
  4. Он должен содержать не более 50000 страниц.
  5. Файлов может быть несколько: если не удается уложиться в лимит на 50000 страниц, то стоит создать дополнительные карты. Ссылки на них указываются в основном файле

Как создать карту сайта с помощью онлайн-генераторов

Этот способ хорош тем, что вам не приходится привязываться к определенному движку. С помощью онлайн-генераторов можно сделать sitemap.xml для сайта на любой CMS или для статичного сайта на HTML.

У этого способа есть минус. Он подходит лишь для сайтов с ограниченным количеством страниц, например, для сайтов-визиток. Если на сайте пять страниц, а новые создавать не планируется, сделать sitemap.xml можно один раз с помощью бесплатного внешнего сервиса.

Если на сайте регулярно появляются новые страницы, бесплатные внешние программы для генерации не подойдут. Они не включают в карту сайта новые URL, поэтому sitemap.xml теряет актуальность.

Вот несколько генераторов карты сайта:

https://www.xml-sitemaps.com/
http://www.mysitemapgenerator.com/ru/
https://xmlsitemapgenerator.org/
http://www.web-site-map.com/

Следует указать главную страницу и запустите процесс. Полученный файл можно загрузить на сервер, в корневую директорию на сайте. Это делают с помощью FTP-клиента или файлового менеджера используемого хостинга

Генерация sitemap.xml при помощи паука Screaming Frog

Карту сайта можно получить из выгрузки пауком Screaming Frog SEO Spider. После парсинга страниц сайта удастся получить необходимый список страниц. В пауке есть функция генерации карты сайта в XML формате на основе полученных данных.

Единственный минус такого подхода: отсутствие автоматизированного генерирования карты, т.е. при добавлении новых страниц на сайт потребуется вносить ссылки на них вручную. В идеале CMS вашего сайта должна добавлять каждую новую страницу в xml файл автоматически.

Подробнее про паука и сам процесс генерации карты вы можете прочитать в другой статье.

ИНТЕРНЕТ-МАРКЕТИНГ
РАЗРАБОТКА САЙТОВ
SEO продвижение

Как создать sitemap.xml при помощи CMS

Этот способ создания карты сайта удобнее по сравнению с бесплатными онлайн-генераторами. Он обеспечивает дополнительную гибкость: вебмастер может управлять параметрами sitemap.xml. Кроме этого, надстройки автоматически обновляют карту сайта после создания новых страниц и уведомляют об этом поисковые системы.

Если ваш сайт работает на WordPress, обратите внимание на следующие популярные плагины, которые можно просто установить:

  • Google XML Sitemaps;
  • Yoast SEO.

Это не единственные плагины для WP, с помощью которого создаются карты сайта. Например, в комбайне All in One SEO есть модуль «Sitemaps».

Функция создания Sitemap в WP через плагин All in ONE SEO

Встроенная в 1C-Битрикс функция

Настройка sitemap.xml доступна в разделе «Маркетинг» административной панели.

Переход к настройкам карты

Добавьте файл, назовите его, а затем активируйте чекбокс о добавлении ссылки в robots.txt.

Добавьте имя и разрешение на запись в роботс

Во вкладке «Файлы» выберите разделы, которые необходимо предоставить для индексации поисковым роботам:

Определите разделы, которые надо индексировать

То же самое делается во вкладке «Инфоблоки».

Сохраните все изменения и нажмите кнопку «Запустить»:

Завершение настройки

Модули для других CMS

  1. Joomla: используйте плагины OSMap (бесплатная версия Free и платная Pro), jSitemap (платное расширение, но предлагает целый набор SEO-инструментов).
  2. Drupal: модуль XML Sitemap.
  3. Magento: настройте Site Map Configuration.

Выбирайте подходящий способ создания XML-карты сайта и оставляйте указания поисковым роботам, какие страницы им необходимо посетить — это позволит быть уверенным, что поисковый робот проиндексирует все необходимые страницы вовремя.

Как рассказать поисковым роботам про xml карту

Как добавить карту в Google Search Console и «Яндекс.Вебмастер»

Добавить файл sitemap.xml в разделы «Индексирование — Файлы Sitemap» Яндекс.Вебмастера и «Файлы Sitemap» в Google Search Console.

Добавление карты в Вебмастер

Добавление карты в Google Search Console

Яндекс и Google не только проверят добавленный файл, но и в результатах проверки укажут на возможные ошибки.

Указать в robots.txt:

Указать ссылку на файл в директиве sitemap файла robots.txt:

Указываем ссылку на карту в файле роботс.

Подробнее о robots.txt читайте в другой статье сайта

Как использование sitemap.xml влияет на SEO

Само по себе отсутствие файла sitemap.xml не будет считаться главной причиной для понижения сайта в выдаче поиска. Однако важно учитывать тот факт, что поисковый робот в некоторых случаях может не увидеть отдельные страницы сайта, особенно если он имеет тысячи страниц.

Карта сайта sitemap дает возможность ускорить время индексации страниц, а это благоприятно влияет на определение первоисточника документа, что важно в случае, когда кто-то из конкурентов захочет скопировать, например, статью.

Важно в карту сайта включать лишь те страницы, которые робот должен проиндексировать. Обязательно исключите из него все технические страницы (в robots.txt), не предназначенные для индексации поисковыми системами, поскольку это может отрицательно сказаться на оптимизации и продвижении сайта.

Автор

Артём Опарин

Артём Опарин

ИНТЕРНЕТ-МАРКЕТОЛОГ С ОПЫТОМ БОЛЕЕ 10 ЛЕТ.

Подписывайтесь в соцсетях:

Комментарии

Вам также может понравиться

Баннерная реклама в интернете: виды, форматы, создание, размещение и анализ эффективности
26 ноября 2024
246
Баннерная реклама в интернете: виды, форматы, создание, размещение и анализ эффективности
Баннерная реклама стала одним из ключевых инструментов интернет-маркетинга практически с самого зарождения всемирной паутины. Термин "баннер" происходит от английского "banner" - знамя, полотнище...
Читать
Упрощаем управление продвижением в Яндекс.Директе с помощью Коммандера
14 ноября 2024
228
Упрощаем управление продвижением в Яндекс.Директе с помощью Коммандера
"Директ Коммандер" - это мощный инструмент для эффективного управления рекламными кампаниями в Яндекс.Директе. Разработанный специалистами самой поисковой системы, он призван значительно упростить...
Читать
Копирайтинг - ваш проводник в мир цепляющего контента и успешных продаж
17 июня 2024
483
Копирайтинг - ваш проводник в мир цепляющего контента и успешных продаж
Копирайтинг - это искусство создания текстов, ориентированных на решение конкретных задач в области маркетинга и продвижения товаров или услуг. Копирайтер - специалист, который профессионально зан...
Читать
Анализ конкурентов &quot;с чем его едят&quot;?
29 июля 2022
442
Анализ конкурентов "с чем его едят"?
Не учитывать изменения рынка и конкурентов, занимаясь продвижением, невозможно. И для того, чтобы оперировать полезной и структурированной информацией, важно проводить грамотный анализ. При этом с...
Читать
Модель AIDA: Исчерпывающий обзор концепции, проверенной временем
17 февраля 2025
195
Модель AIDA: Исчерпывающий обзор концепции, проверенной временем
Техника AIDA является одной из самых известных и проверенных временем моделей в сфере маркетинга и продаж. Ее широкое распространение и популярность объясняются простотой, структурированностью про...
Читать
Нетворкинг - формула успеха для карьерного роста
16 августа 2024
312
Нетворкинг - формула успеха для карьерного роста
Цели и преимущества нетворкинга Нетворкинг преследует несколько основных целей, напрямую связанных с карьерным ростом, развитием бизнеса и личной эффективностью: Доступ к экспертным...
Читать
Энциклопедия FTP: Полный Путеводитель по Протоколу Передачи Файлов
5 августа 2024
736
Энциклопедия FTP: Полный Путеводитель по Протоколу Передачи Файлов
Протокол FTP (File Transfer Protocol) является одним из фундаментальных и широко используемых стандартов передачи данных в компьютерных сетях. Его история началась еще в 1971 году, задолго до появ...
Читать
Что такое дашборды и как они помогают бизнесу принимать правильные решения
13 ноября 2024
258
Что такое дашборды и как они помогают бизнесу принимать правильные решения
Определение дашборда В современном мире, где объемы данных растут экспоненциально, а принятие решений требует оперативности и точности, дашборды становятся неотъемлемым инструментом для бизнеса. ...
Читать
Модуль подмены названия товара на листинге: для чего это нужно?
22 июля 2022
708
Модуль подмены названия товара на листинге: для чего это нужно?
Предлагаю сейчас разобрать несколько модулей, которые позволяют усилить релевантность страницы по облаку, как в ширь, так и в глубь. Модуль подмены названий на листинге В двух своих кейсах ...
Читать
Что такое дипфейк: как создать и зачем использовать в рекламе
8 ноября 2024
230
Что такое дипфейк: как создать и зачем использовать в рекламе
Дипфейк (англ. deepfake, сокращение от deep learning и fake - "глубокое обучение" и "подделка") - это метод синтеза аудиовизуального контента с применением технологий искусственного интеллекта и м...
Читать
Мониторинг посещаемости сайтов конкурентов - залог успешного интернет-маркетинга
27 августа 2024
208
Мониторинг посещаемости сайтов конкурентов - залог успешного интернет-маркетинга
Посещаемость сайта - это ключевой показатель, отражающий количество уникальных пользователей, которые заходили на веб-ресурс за определенный период времени. Анализ посещаемости позволяет оценить э...
Читать
Инструменты для быстрого парсинга частотностей ключевых фраз и максимальный сбор ключей из Wordstat
16 октября 2020
1850
Инструменты для быстрого парсинга частотностей ключевых фраз и максимальный сбор ключей из Wordstat
В этой статье я хочу поделиться своими методами повышения эффективности использования времени и получения качественных результатов. Мы разберем ряд инструментов и я кратко опишу их плюсы. Погнали...
Читать
DNS-сервер: как работает система доменных имен в деталях
1 ноября 2024
559
DNS-сервер: как работает система доменных имен в деталях
Доменные имена стали неотъемлемой частью современного интернета, позволяя людям легко находить нужные сайты и сервисы по их запоминающимся названиям вместо сложных цифровых IP-адресов. Система дом...
Читать
Важность заключения договора с разработчиком: подводные камни и нюансы
25 августа 2022
399
Важность заключения договора с разработчиком: подводные камни и нюансы
В разработке я уже более 10 лет — работал и самостоятельно, и в команде, и с привлечением фрилансеров. За это время я получил достаточно опыта взаимодействия с сотрудниками, и могу рассказать о ра...
Читать
Метатег Description: пошаговое руководство по созданию эффективных описаний
4 февраля 2025
254
Метатег Description: пошаговое руководство по созданию эффективных описаний
Метатег Description является одним из ключевых элементов технической оптимизации сайта, играющим важную роль в продвижении веб-ресурса. Этот HTML-элемент представляет собой краткое описание содерж...
Читать
Маскоты в веб-дизайне: Как персонажи бренда усиливают маркетинг и улучшают пользовательский опыт
22 мая 2025
18
Маскоты в веб-дизайне: Как персонажи бренда усиливают маркетинг и улучшают пользовательский опыт
Маскот на сайте или в мобильном приложении – это не просто визуальный элемент, но и мощный маркетинговый инструмент. В последние годы маскоты приобрели популярность среди брендов, стремящихся повы...
Читать
Ссылки для SEO: разбираемся с акцепторами, донорами и эффективными стратегиями наращивания
1 января 2025
257
Ссылки для SEO: разбираемся с акцепторами, донорами и эффективными стратегиями наращивания
Продвижение сайта в поисковых системах – важнейшая задача для любого бизнеса, стремящегося привлечь целевую аудиторию и увеличить продажи через интернет. Наряду с внутренней оптимизацией контента ...
Читать
Максимизируйте отдачу от тизеров: анализ трендов, оптимизация и перспективы 2025
26 декабря 2024
179
Максимизируйте отдачу от тизеров: анализ трендов, оптимизация и перспективы 2025
Тизерная реклама представляет собой один из наиболее эффективных и широко используемых видов интернет-маркетинга в современном мире. Ее основная цель заключается в создании интриги и вовлечении по...
Читать
Что такое CPV (Cost Per View): формула расчета, преимущества и отличия от CPM
25 февраля 2025
198
Что такое CPV (Cost Per View): формула расчета, преимущества и отличия от CPM
В современном интернет-маркетинге выделяют множество различных моделей ценообразования и закупки рекламы. Среди наиболее распространенных - CPM (Cost per Mille - оплата за тысячу показов), CPC (Co...
Читать
Технический SEO-аудит: главные направления для анализа качества сайта
19 апреля 2022
1308
Технический SEO-аудит: главные направления для анализа качества сайта
Как и когда проводят СЕО-аудит СЕО-аудит – процедура, в ходе которой проверяют, насколько ресурс отвечает требованиям поисковиков. По результатам проверки сайт должен стать понятным для поисковых...
Читать
Robots.TXT: полная инструкция по созданию, настройке и использованию директив под нужды SEO
21 марта 2022
6583
Robots.TXT: полная инструкция по созданию, настройке и использованию директив под нужды SEO
Что такое robots.txt Robots.txt — это стандартный текстовый файл в кодировке UTF-8 с расширением .txt, который содержит директивы и инструкции индексирования сайта, его страниц или разделов. Он н...
Читать
Апдейты поисковых систем: угрозы и возможности для вашего бизнеса
16 сентября 2024
285
Апдейты поисковых систем: угрозы и возможности для вашего бизнеса
Апдейты в поисковых системах являются неотъемлемой частью процесса постоянного совершенствования поисковой выдачи. Они представляют собой регулярные обновления баз данных и алгоритмов ранжирования...
Читать
Уникализация карточки товара
5 августа 2022
663
Уникализация карточки товара
Внутренние дубли — это страницы сайта, которые имеют уникальные URL-адреса, но при этом на них одинаковый или почти идентичный контент. Они плохо влияют на SEO и могут доставлять проблему. Как пра...
Читать
Коллтрекинг - ключ к эффективной рекламе и максимизации продаж
9 апреля 2025
163
Коллтрекинг - ключ к эффективной рекламе и максимизации продаж
Для современного бизнеса, ориентированного на клиентоцентричность, телефонные звонки от потенциальных покупателей играют крайне важную роль. Согласно исследованиям, более 60% людей перед совершени...
Читать
Sitemap.xml: как создать и для чего нужна карта сайта
8 апреля 2022
2371
Sitemap.xml: как создать и для чего нужна карта сайта
Что такое карта сайта sitemap.xml XML-карта сайта — файл с информацией для поисковых систем о тех страницах, которые требуется проиндексировать. Другими словами, карта сайта — полный перечень все...
Читать
Создание плитки тегов через SEO — умного фильтра модуль «Сотбит»
16 октября 2020
3024
Создание плитки тегов через SEO — умного фильтра модуль «Сотбит»
Часть 2 — Создание плитки тегов через SEO — умного фильтра модуль «Сотбит» https://marketplace.1c-bitrix.ru/solutions/sotbit.seometa/ Стоимость 14990 рублей. Принцип работы модуля: ...
Читать
Кластеризация запросов: виды и методы группировки, алгоритмы и софт
20 мая 2022
3580
Кластеризация запросов: виды и методы группировки, алгоритмы и софт
Что такое кластеризация Кластеризацией запросов называют группировку семантического ядра по кластерам. Каждый из них продвигается на отдельных посадочных страницах. Грамотная кластеризация очень ...
Читать
Браузер - связующее звено в цифровой эпохе: руководство по выбору и использованию
4 апреля 2025
144
Браузер - связующее звено в цифровой эпохе: руководство по выбору и использованию
Браузер - это программное обеспечение, без которого невозможно представить современный интернет. Он выступает своеобразным окном, через которое мы получаем доступ к бесчисленному множеству веб-сай...
Читать
Что такое глоссарий: виды, преимущества и пошаговое руководство по созданию
12 февраля 2025
354
Что такое глоссарий: виды, преимущества и пошаговое руководство по созданию
Глоссарий - это упорядоченный список терминов с соответствующими определениями или пояснениями. Он представляет собой своеобразный мини-словарь, посвященный какой-либо узкой теме, области знаний и...
Читать
Что такое SSL сертификат?
3 ноября 2021
1285
Что такое SSL сертификат?
В данной статье постараемся разобраться с таким элементом сайта, как SSL сертификат, для чего он нужен. Что такое SSL сертификат? SSL-сертификат – говоря простым языком, удостоверение лич...
Читать
Как сократить ссылку: обзор ТОП-12 популярных сервисов
10 марта 2023
630
Как сократить ссылку: обзор ТОП-12 популярных сервисов
Когда стоит использовать короткие ссылки Длинные ссылки не только выглядят некрасиво, но и могут быть просто неудобны в использовании. Короткие URL-адреса смотрятся более привлекательно, а...
Читать
Капча: ключ к безопасности веб-ресурсов в эру ботов
17 июля 2024
273
Капча: ключ к безопасности веб-ресурсов в эру ботов
Капча - это специальный тест безопасности, с которым многие из нас сталкиваются в интернете. Представьте, вы заходите на сайт, чтобы оставить комментарий или совершить покупку, и вас просят ввести...
Читать
смотреть все