Содержание
Что такое карта сайта
Карта сайта – это список страниц сайта, который создается для пользователя или для поисковой системы. Его можно сравнить с содержанием книги, которое быстро помогает найти нужную часть или страницу.
Отличие XML от HTML карты сайта
Есть два основных формата для карт сайта. Каждый предназначен для разных целей, поэтому на сайте могут присутствовать оба одновременно.
Первый формат – HTML карта – нужен для пользователей и практически не играет роли для поисковых систем. Такая карта размещается на отдельной странице сайта и включает ссылки на самые важные разделы. Особенно актуально для больших сайтов, где невозможно уместить все в меню.
При работе над HTML картой сайта необходимо учитывать следующие принципы:
- Размещать не более 100 ссылок. Создавать многостраничную карту, если большой сайт.
- Отражать структуру сайта в оформлении, это не должно быть простое перечисление URL. Ссылки на страницы должны по возможности показывать визуальный уровень вложенности.
- Ссылки на все страницы должны быть рабочими.
Пример HTML карты сайта показан ниже:
Второй формат – XML карта сайта – наоборот, создается исключительно для поисковых систем. Ее рекомендуется формировать в формате .xml и размещать в корне сайта. Путь к ней обычно выглядит так: https://site.ru/sitemap.xml.
Чаще всего адрес карты сайта указывается в файле robots.txt, чтобы роботы поисковых систем могли легко его найти. В таком документе можно не только перечислить ссылки на страницы сайта, но и указать их особенности. Например, какие страницы приоритетнее, с какой частотой обновляется контент на них.
XML карта сайта – это рекомендация для поисковых систем какие страницы нужно индексировать. С их помощью мы говорим: «Обратите внимание на эти страницы. Эта страница важнее, а другая чуть менее значима. Эта страница обновляется еженедельно, а вот та раз в месяц».
Пример XML карты сайта:
XML карты вызывают больше вопросов, поэтому дальше мы расскажем, как правильно составить sitemap.xml.
Из чего состоит XML карта сайта
В карте сайта используется кодировка UTF-8. Указывается это следующей строкой:
<?xml version=»1.0″ encoding=»UTF-8″?>
Обязательные теги для карты сайта xml:
- <urlset> – родительский тег, открывается после указания кодировки и закрывается в самом конце
- <url> – тег с параметрами конкретного url
- <loc> – тег с самим url
В родительском теге необходимо указывать пространство имен языка XML: xmlns=http://www.sitemaps.org/schemas/sitemap/0.9
Необязательные теги для карты сайта формата xml:
- <lastmod> — тег, который показывает дату последнего обновления страницы
- <changefreq> — тег, который показывает, как часто обновляется страница (может иметь значения: always, hourly, daily, weekly, monthly, yearly, never)
- <priority> — тег, который показывает приоритет одной страницы перед другими (может иметь значения от 0,1 до 1)
Рекомендации к файлу sitemap.xml от поисковых систем
При составлении XML карты сайта необходимо учитывать следующие принципы:
- В карте сайта указывать не более 50 000 ссылок на страницы. Если количество страниц большое, то лучше разделять Sitemap на несколько файлов (далее расскажем, как именно).
- Страницы должны возвращать код ответа сервера 200. В sitemap.xml не нужно включать страницы с кодом ответа 3xx, 4xx, 5xx.
- Размер XML карты не должен превышать 10 Мб.
- В XML карту необходимо добавлять исключительно ссылки того же домена, где расположен файл.
- Карта сайта должна находиться на том же домене, для которого ее составили.
Что такое сводный sitemap.xml
Если в карту сайта необходимо включить более 50 000 ссылок, рекомендуется разбить ее на несколько файлов. Например, это стоит делать при работе с большим интернет-магазином. Для этого нужно:
- создать отдельные карты для разводящих страниц, карточек товара и служебных страниц
- объединить полученные файлы в сводную карту сайта
Сводный, он же индексный, sitemap.xml – это файл, который объединяет ссылки на другие карты сайта.
Обязательные теги для него:
- <sitemapindex> – родительский тег
- <sitemap> – тег с параметрами каждой sitemap
- <loc> – тег со ссылкой на sitemap
Необязательный тег <lastmod> доступен для индексного файла.
Как составить карту сайта XML
Мы рассказали, из чего состоит карта сайта, теперь опишем, с помощью каких инструментов ее сформировать.
Текстовый редактор Notepad++
С его помощью вручную можно сделать небольшую карту сайта, иначе придется потратить много времени.
Существует большое количество платных и бесплатных инструментов для автоматического, полуавтоматического формирования xml карты сайта, рассмотрим некоторые из них.
Программа Screaming Frog SEO Spider
Для того, чтобы создать карту сайта в формате XML необходимо:
- провести парсинг сайта
- зайти в Sitemaps – XML Sitemap
- настроить параметры
- можно выбрать, какие страницы взять в карту сайта и задать теги
- нажать Ок
Предварительно нужно проверить настройки robots.txt, перейдя в Configuration – robots.txt – Settings.
Можно также загрузить уже готовый список страниц для карты сайта.
Необходимо:
- переключить Mode в режим List
- выбрать Upload – Enter Manually
- обойти загруженные страницы
- использовать те же шаги, что описаны выше
Плагины для Content Management System (CMS)
Для всех популярных CMS разработаны плагины, которые создадут карту сайта за вас. Например, Yoast SEO для WordPress, модуль Sitemap.xml для Bitrix, JL Sitemap для Joomla и другие.
Онлайн-генераторы
Сайты, генерирующие sitemap.xml, имеют ограничения по настройкам, либо по количеству индексируемых URL в бесплатной версии. Такие варианты подойдут только для небольших ресурсов. Примеры генераторов: https://www.mysitemapgenerator.com/ru/, https://www.xml-sitemaps.com/
Где указать путь на файл sitemap.xml
Чтобы оповестить поисковых роботов, о том, что была создана карта сайта, необходимо:
- Добавить ссылку на нее в файле robots.txt с помощью директивы sitemap: https://site.ru/sitemap.xml Директива Sitemap – межсекционная. Неважно, в каком месте она будет указана в файле robots.txt, поисковые роботы ее найдут и проиндексируют.
- Добавить ссылку на XML карту сайта в вебмастера Яндекс и Google.
Яндекс.Вебмастер:
Google Search Console:
Что такое карта изображений
Этот вид sitemap.xml используется для заполнения атрибутов Alt и Title изображений.
Он является инструментом SEO-оптимизации в поиске по картинкам, который приводит дополнительный трафик на сайт. Особенно актуально, если изображения на сайте подгружаются через Javascript. В этом случае поисковые системы не проиндексируют изображения без вашей помощи.
Карту картинок можно делать в отдельном файле, а можно добавить информацию об изображениях в основной sitemap.xml. Если используется отдельный файл, то ссылку следует разместить в robots.txt и в кабинетах: Яндекс Вебмастер и Google Search Console. Можно указывать не более 1 000 изображений для каждой страницы.
Обязательные теги:
- <image:image> – тег с параметрами изображений
- <image:loc> – тег со ссылкой на картинку
Необязательные теги:
- <image:caption> – тег, передающий подпись к изображению
- <image:geo_location> – тег, передающий место съемки
- <image:title> – тег, передающий название изображения
- <image:license> – тег со ссылкой на лицензию изображения
Ниже показан пример sitemap.xml с записью об изображениях, который приводит в своих рекомендациях Яндекс:
Создать карту изображений можно вручную, с помощью плагинов для CMS, и, например, Screaming Frog (стоит выбирать Images Sitemap вместо XML Sitemap).
Как проверить карту сайта на ошибки
Перед выгрузкой sitemap.xml на сайт необходимо проверить ошибки. Для этого нужно:
- Загрузить текст карты сайта, ссылку на нее или файл в «Анализ файлов Sitemap» в Яндекс.Вебмастер. Сервис покажет наличие или отсутствие ошибок, вес файла и количество ссылок.
- Использовать программу Screaming Frog, чтобы проверить открыты ли страницы для индексации и какой код ответа они отдают. Он должен быть 200 OK.
В инструменте можно загрузить список URL через режим List, Upload Manually. А можно выгрузить карту, уже размещенную на сайте. Для этого в режиме List нужно выбрать Upload – Download XML Sitemap.
Зайти на вкладку URL, отфильтровать по Parameters, чтобы проверить, не попали ли в карту сайта URL с GET-параметрами.
Заключение
Карта сайта в формате XML – это способ передать поисковым системам информацию о страницах сайта. Не игнорируйте этот инструмент. Он будет полезен как для крупных, так и для небольших проектов.
Если у вас остались вопросы, обращайтесь к специалистам TRINET. Мы с удовольствием поделимся опытом и поможем в решении ваших задач.