Sitemap (карта сайта) – это файл формата XML, расположенный в корне сервера, или HTML-документ, где содержатся ссылки на важные для SEO продвижения сайта страницы, которые следует проиндексировать поисковым системам.
Для чего нужна?
Карту сайта можно сравнить с оглавлением в книге, содержащим перечень всех важнейших разделов. На сайте это такой каталог, где указаны ссылки на главные разделы и страницы веб-ресурса. В целом же в сайтмап находится следующая информация:
- список URL-адресов страниц сайта в иерархическом порядке;
- формат появившегося на сайте контента: текст, видео, картинки;
- сведения о видео и изображениях, необходимые роботам для их внесения в базу данных и формирования поисковой выдачи;
- информация о приоритетности страницы;
- данные о внесении последних изменений документов и регулярности их обновлений;
- сведения про другие версии веб-страницы.
Sitemap помогает посетителям и особенно роботам поисковиков быстро определять расположение всех самых необходимых для индексации страниц, а также их важность по отношению к другим документам, частоту и время последнего изменения, при этом делать как можно меньше «лишних» переходов. Sitemap помогает системе индексировать ресурс более эффективно.
Да, на мелких сайтах к любому документу можно перейти всего в пару кликов, но вот крупные содержат по несколько тысяч страниц и структура их куда сложнее. Без Sitemap на таких ресурсах будет сложно и посетителям, и поисковым ботам.
Исходя из вышеописанного можно выделить три основных ситуации, в ходе которых возникают проблемы с индексацией ресурса и нужен сайтмап:
- огромное число страниц;
- сложная структура ресурса;
- отсутствие внешних либо внутренних бэклинков на важные для индексации страницы.
На заметку. Применение карты сайта не дает стопроцентной гарантии того, что все указанные здесь страницы попадут в индекс поисковиков. Она лишь дает рекомендации краулерам для более рационального сканирования документов.
Виды карт
Любой поисковик вносит страницы сайта в индекс постепенно, начиная с главной страницы и заканчивая документами с глубокой вложенностью это зависит какой краулинговый бюджет имеет сайт.
Чтобы ускорить индексацию веб-сайта необходимо создать файл Sitemap. Он делится на несколько видов в зависимости от того, с какой именно целью вы его создаете.
HTML
Представляет собой страницу, где находятся ссылки на статьи и разделы ресурса. HTML карта создана для живых посетителей и меньше подходит роботам, помогая нам с вами быстрее находить интересующие разделы.
У данного документа есть рекомендуемый лимит на количество доступных к размещению ссылок. Если их будет больше положенного, то в лучшем случае многие из них просто не попадут в поиск. А в худшем – вся страница может улететь из выдачи за злоупотребление ссылками, даже если они внутренние.
Во избежание этого в карте сайта рекомендуется размещать не больше 200 ссылок. Этого количества вполне хватит для размещения всех важных разделов и даже их подразделов, не попавших в главное меню. Так поисковые системы грамотно проиндексируют Sitemap, а посетителям будет легче воспринимать его содержание.
Структура HTML Sitemap древовидная, здесь указаны раскрытые разделы и подразделы. Слишком масштабные HTML-карты разбавляют графическим оформлением, элементами JavaScript и стилями CSS. Делая sitemap.html важно отталкиваться от:
- Структуры содержания. Пользователь должен легко разобраться в карте сайта и быстро отыскать нужный ему контент.
- Ссылочных анкоров. Здесь для каждой ссылки необходимо прописать название, что поможет пользователям вкратце понять содержание страницы, на которую они хотят перейти.
- Доступность ссылки. В большинстве случаев на карту сайта можно перейти, кликнув по ссылке в подвале (футере) – так она доступна на всех страницах.
На заметку. HTML карта сайта не настолько значима для поисковых машин, чтобы ее можно было считать полноценным ресурсом для продвижения. Если вы хотите указать в файле ссылки на более чем 200 веб-страниц, то лучше создать XML-карту.
Пример
XML
Это файл формата .xml, находящийся в корневой директории веб-ресурса. Основное отличие от sitemap.html состоит в том, что он упрощает работу ботам и вмещает в себе около 50 тысяч линков. Еще он позволяет выставлять приоритетность документов относительно других и частоту их обновлений. Данный формат файла поддерживают все популярные поисковики.
Sitemap.xml тоже несет лишь рекомендательный характер и боты могут не следовать ему. Допустим, вы установили для одной из страниц частоту обновления не более одного раза в месяц, но краулеры вероятнее всего продолжат обходить ее согласно собственному плану.
Структура данного вида Sitemap отличается определенным порядком.
Пример
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://mysite.ru/</loc>
<lastmod>2014-09-18T18:54:13+04:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://mysite.ru/category/</loc>
<lastmod>2014-09-18T18:57:09+04:00</lastmod>
<changefreq>hourly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://mysite.ru/page/</loc>
<lastmod>2014-09-18T18:59:37+04:00</lastmod>
<changefreq>daily</changefreq>
<priority>0.6</priority>
</url>
</urlset>
Здесь есть три обязательных тега:
- <urlset> – родительский тег, внутри которого указываются все УРЛы;
- <url> – тег, где заключается информация об одном определенном URL-адресе;
- <loc> – здесь содержится непосредственно УРЛ.
Все остальные – необязательные теги:
- <lastmod> – в нем указывается дата последнего обновления документа;
- <priority> – здесь сообщается приоритет конкретной веб-страницы относительно других документов: начинается от 0,1 (самый низкий приоритет), и заканчивается 1 (наивысший приоритет);
- <changefreq> – тег указывает частоту изменения документа: never (никогда), yearly (ежегодно), monthly (ежемесячно), weekly (еженедельно), daily (ежедневно), hourly (каждый час), always (всегда).
Еще в файле sitemap.xml нужно прописывать команды для указания на пространство имен языка XML:
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
Если в сайтмапе нужно разместить больше 50 тысяч ссылок либо размер файла карты стал превышать более 10 мегабайт, поделите его на несколько XML файлов. Тогда в Sitemap обязательно укажите ссылки на все карты:
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://mysite.ru/sitemaps/sitemap01.xml</loc>
<lastmod>2014-09-18T18:54:13+04:00</lastmod>
</sitemap>
<sitemap>
<loc>http://mysite.ru/sitemaps/sitemap02.xml</loc>
<lastmod>2014-09-18T18:54:13+04:00</lastmod>
</sitemap>
</sitemapindex>
Тут вы можете заметить уже вышеупомянутые теги <loc> (обязательный) и <lastmod> (необязательный), а кроме них еще пару обязательных:
- <sitemap> – тег, где указываются данные для всех файлов Sitemap в формате XML;
- <sitemapindex> – родительский тег, куда прописываются УРЛы всех карт сайта.
Пример xml карты сайта, вы можете посмотреть на нашем сайте https://seob.ru/sitemap_index.xml
TXT
Еще один метод оформления карты сайта – файл Sitemap в txt (текстовом формате). Здесь содержится перечень всех важных для индексации ссылок. А вообще данный вариант актуален для вебмастеров, которые не желают особо заморачиваться.
Да, в TXT карте можно тоже разместить 50 тысяч ссылок, но в ней нет возможности указывать дату последнего изменения и относительную приоритетность документов.
Пример
1. http://site.com/;
2. http://site.com/page1/;
3. http://site.com/page2.
Требования Яндекса и Google к картам
Я выделил 6 общих требований, которые два популярнейших поисковика выдвигают к файлу Sitemap:
- Необходимо применять UTF-8 кодировку.
- Лимит по количеству URL-адресов – до 50 тысяч ссылок.
- Если размер файла превышает 10 МБ, поделите его на несколько карт и пропишите их все в файле индекса Sitemap.
- В процессе обращения к сайтмапу сервер должен отправлять ответ 200 OK.
- Вносите исключительно канонические УРЛы документов: не должно быть никаких идентификаторов сессий или GET-параметров.
- Ссылки в файле должны вести на тот же домен, где располагается сама карта сайта. Казалось бы, это элементарное требование. Но на деле многие вебмастера, имеющие несколько веб-ресурсов, перенося шаблон с файлом Sitemap забывали поменять уже имеющиеся ссылки на актуальные.
Есть у поисковых систем и свои, уникальные требования.
Яндекс:
- максимально допустимый размер – 10 МБ;
- допускается применять URL-адреса с кириллическими символами.
Google:
- максимально допустимый размер файла – 50 МБ;
- работает только с латинскими символами и цифрами (кириллические домены можно перекодировать в латинские посредством Punycode).
Важно! Для уменьшения требований к пропускной способности канала применяется архиватор gzip. 10 и 50 МБ – это размеры файлов Sitemap до сжатия архиваторов, а не после.
Влияет ли карта сайта на продвижение?
Отмечу, что без сайтмапа поисковики не понизят ваш ресурс в выдаче. Поисковые системы не глупые и даже если у вас на сайте нет Sitemap, они все равно проиндексируют его.
Сейчас поисковые машины даже без карты сайта сканируют страницы и включают их в выдачу довольно хорошо. Да и в теории они самостоятельно должны этим заниматься, безо всякой помощи со стороны вебмастеров.
Но нередко возникают проблемы, когда роботы дают сбой и не могут просканировать все страницы. Зачастую это случается из-за:
- глубокой вложенности некоторых разделов, для перехода на которые необходимо перейти по множеству ссылок;
- динамических УРЛов.
Поэтому в интересах вебмастеров помогать поисковым системам.
Наличие карты сайта позволяет избежать данных ситуаций. Sitemap в определенной степени положительно влияет на SEO продвижение веб-ресурса, потому что делает для роботов процесс обхода и включения в поиск страниц быстрее и легче.
Еще с данным файлом у вашего ресурса уменьшается риск превратиться из первоисточника в копипаст вследствие того, что страницы попадут в индекс раньше, чем конкурентам удастся украсть контент с него и разместить у себя.
Важно! Добавляйте в Sitemap основные страницы, играющие ключевую роль в оптимизации сайта, чтобы они попали в выдачу в первую очередь. Не прописывайте в файле страницы со служебной информацией, динамическими URL, тегами и запрещенные к индексации.
Можно ли без Sitemap?
Ответ очевидный – да. Поисковики воспринимают sitemap.xml лишь в качестве рекомендации для роботов. На практике у веб-ресурсов, где нет карты сайта, Яндекс отмечает наличие возможных, а не критичных либо фатальных проблем.
Как было написано выше, поисковые роботы способны самостоятельно и эффективно индексировать ресурсы, но крупным сайтам и тем, где есть динамические УРЛы, лучше сделать Sitemap, к тому же это не займет много времени, а в дальнейшем может прилично сэкономить ваши нервы.
Как создать карту сайта?
К данному процессу нужно подойти ответственно, потому что здесь необходимо указать основные страницы, которые вы хотите видеть в поисковой выдаче.
HTML
Сайтмап в формате HTML – это прежде всего навигация по разделам сайта для пользователей. Если веб-ресурс имеет лишь несколько сотен страниц, у него простая структура и понятное меню, подключать HTML-карту необязательно.
Но когда сайт масштабный и структура довольно сложная, есть смысл создать страницу с перечнем ссылок на основные страницы.
Учитывайте нишу, к которой относится ваш ресурс и соответственно его целевую аудиторию. Если у вас посетители преимущественно пожилого возраста, карта сайта поможет им сориентироваться в сайте, так как в главном меню разобраться сложнее.
Есть множество способов, как создать Sitemap в формате HTML на движке WordPress. Лучше всего сделать это посредством плагина Hierarchical HTML Sitemap и ему подобных. Скачиваете плагин для своей CMS, устанавливаете, а дальше активируете надстройку для установки файла. После – размещаете выданный плагином шорткод на страницу, где хотите подключить сайтмап.
Карта сайта будет доступна по адресу:
http://site.com/sitemap.html
Для других движков есть такие решения:
Тем кто пользуется OpenCart не нужно беспокоиться о создании HTML карты сайта, потому что она появляется там автоматически.
XML
Если решили создать XML карту сайта, определитесь, каким способом будете это делать:
- Cгенерировать сайтмап при помощи движка управления ресурсом, если у него есть соответствующая встроенная функция, используя различные плагины и модули.
- Скачать ПО-генератор. Большинство из этих программ платные, но благодаря ним вы можете с легкостью создавать XML файл как для одного, так и для нескольких ресурсов. Вот самые популярные: WonderWebWare SiteMap Generator и SiteMap XML Dynamic SiteMap Generator.
- Скачать файл Sitemap онлайн генератором. Выбор специальных сервисов сегодня очень велик, у всех у них разные ограничения и возможности. К примеру, на сайте xml-sitemaps.com настраивается изобилие параметров карты, но разместить в ней можно максимум 500 ссылок.
- Ручное подключение Sitemap.
С помощью генератора онлайн
Преимущество данного способа заключается в отсутствии привязки к какому-либо CMS. Онлайн генераторы позволяют создать карту сайта для веб-ресурсов на любых движках и даже на статичных HTML сайтах.
Минус же использования генераторов в том, что бесплатные сервисы сильно ограничены по количеству страниц и больше подходят, например, для сайтов-визиток, где есть несколько страниц и новые появляться уже не будут.
Если же ресурс регулярно пополняется новыми статьями, то бесплатные генераторы не подойдут. Они не обновляют Sitemap, поэтому там не будут появляться новые URL-адреса, из-за чего файл быстро станет неактуальным.
Самый популярный генератор:
Приведу пример, как создать XML карту с XML-Sitemaps.
Заходите на сайт сервиса и указываете адрес своего ресурса, кликаете на кнопку START.
Через несколько минут сайтмап в формате XML будет сгенерирован. Далее закачиваете файл на жесткий диск компьютера.
Затем нужно загрузить Sitemap в корневую папку сайта при помощи FTP-клиента, к примеру, WinSCP. Если не знаете где искать корневой каталог, введите в поиске index.html. Сюда загружаете файл.
Через программное обеспечение
Создать XML карту сайта данным способом не так уж сложно. Сейчас я покажу, как это сделать на примере программы для ПК Majento:
- Парсите ресурс.
- В верхней вкладке заходите в раздел «Сайты», затем кликаете «Генерировать Sitemap».
- Сохраняете файл в .xml формате.
- Все – карта на вашем сайте.
Посредством плагинов для CMS
Данный вариант куда удобнее, чем бесплатные генераторы онлайн. Плагины для движков управления сайтами более функциональные, позволяют изменять параметры карты сайта. А один из главных плюсов – наличие надстроек для автоматического обновления файла сразу после появления новых документов, а также уведомления о них поисковым системам.
Для сайтов на базе WordPress одним из лучших вариантов является модуль Google XML Sitemaps. Установите, а затем активируйте плагин. Далее зайдите в настройки.
В основных параметрах включите оповещения для Google, укажите адрес карты сайта в файле robots и активируйте функцию сжатия Sitemap.xml.
Перейдите в «Приоритет статьи» и отключите функцию автоматической приоритезации страниц. Потом вам нужно будет указать приоритеты публикаций самостоятельно. Загляните в раздел «Содержание Sitemap». Включите в карту сайте исключительно те типы документов, которые вы хотите проиндексировать.
Не забудьте поставить галочку напротив Include the last modification time. Так модуль покажет роботам в сайтмапе дату последнего обновления страницы, что поможет им рассчитать дату повторного обхода сайта.
Опция Change Frequencies позволяет выставить периодичность переиндексации определенных типов документов. Зачастую поисковики не следуют тегу changefreq, прописанному в файле Sitemap, потому что они самостоятельно определяют краулинговый бюджет ресурса и отталкиваются от него.
Однако плагин предоставляет возможность дополнительно настроить периодичность сканирования, но и это будет рекомендацией, а не командой.
Excluded Items позволяет удалить из sitemap.xml определенные документы либо категории.
Вкладка «Приоритеты» говорит сама за себя. Здесь указывается приоритетность страниц, значения для них выставляются от 0,1 до 1. Изначально у каждой страницы стоит значение 0,5. Выставьте наивысший приоритет самым важным для ранжирования страницам.
Информация про рекомендуемую частоту обновления, приоритетность страниц и дату последнего обновления не является обязательной. В конечном итоге поисковики сами определяют, как поступать.
В конце обязательно сохраните изменения в настройках. Плагин продолжит функционировать в фоновом режиме и уже не будет необходимости в него заходить – карта сайта продолжит оставаться актуальной, так как все обновляется автоматически. Далее нужно лишь добавить файл в вебмастерские панели Яндекса и Google.
Для изображений
Поисковый гигант работает также с картами сайта, предназначенными для изображений. Благодаря ему роботы Google могут получать больше данных про изображения на сайте. Еще синтаксис помогает поисковику быстрее находить и индексировать картинки, которые ему не удалось отыскать в процессе сканирования ресурса.
Можно сделать синтаксис для картинок отдельно либо добавить его в уже созданный Sitemap. В сайтмапе для изображений, как и в стандартном, содержатся необязательные и обязательные теги XML.
К числу обязательных относятся:
- <image:loc> – УРЛ-адрес картинки;
- <image:image> – тег, подобный <url>, содержащий в себе адрес и другую информацию касательно изображения.
Необязательные теги следующие:
- <image:caption> – подпись для картинки;
- <image:title> – название картинки;
- <image:geo_location> – место, где делалось фото;
- <image:license> – УРЛ лицензии картинки.
Для видео
Google еще поддерживает карты сайта в формате XML, предназначенные специально для видео. Преимущества данного синтаксиса следующие:
- позволяет показать поисковикам подробное описание видеофайла;
- показывает ботам тип контента на ресурсе;
- в результатах выдачи может отображать заставку для видеоролика, что в потенциале повышает клики и переходы на сайт;
- контент можно будет найти в Google Видео.
XML карта для видео включает в себя обязательные теги:
- <video:video> – содержит все данные о видеофайле;
- <loc> – в нем прописывается УРЛ страницы, где есть видео, а при наличии более одного видеофайла на странице в теге можно прописать несколько <video:video> для каждой видеозаписи отдельно;
- <video:description> – описание к видео, которое необходимо прописывать на основе метаданных страницы, а количество символов не должно превышать 2048;
- <video:thumbnail_loc> – адрес заставки (миниатюры) для видеофайла с допустимыми размерами от 160x90 до 1920x1080 пикселей и возможными форматами png, gif, jpg, or;
- <video:title> – заголовок для видео, который нужно указать аналогично названию документа, где размещена видеозапись.
Описание и заголовок видеофайла необходимо либо экранировать, либо поместить в блок CDATA. Сгенерировать видео для sitemap.xml можно используя плагин WP Video SEO.
TXT
Необходимо создать текстовый файл в кодировке UTF-8. В нем прописывать исключительно УРЛы страниц, которые следует проиндексировать.
Где разместить карту сайта?
Файл Sitemap лучше всего размещать в корневой папке веб-ресурса. А ссылка на карту сайта размещается в robots.txt. Выглядеть она должна примерно так:

Наглядно посмотреть можно в нашем примере robots.txt по ссылке https://seob.ru/robots.txt
Как добавить в Яндекс Вебмастер
Сайтмап предоставляет возможность сообщить поисковой системе про актуальную структуру ресурса, поэтому его можно добавить в панель вебмастера Яндекса.
Здесь можно:
- Загрузить карту сайта.
- Оповестить о ее обновлении.
- Исключить файл.
Загрузка
На странице «Файлы Sitemap»:
- Выберите веб-ресурс из списка.
- Укажите в соответствующем поле УРЛ-адрес расположения файла.
- Кликните «Добавить».

Так вы отправите карту сайта на обработку. Поисковый бот загрузит файл не позже чем через 14 дней. Все добавляемые файлы поисковая машина обрабатывает по-отдельности. Когда файлы загрузятся, напротив каждого из них отобразится статус:
- ОК. Файл создан корректно и загружен в базу данных. Возле него будет показана дата последнего обновления. Документы, которые роботы уже проиндексировали, отобразятся в результатах выдачи не позже чем через 2 недели.
- Редирект. Адрес файла перенаправляет на другой УРЛ. В данном случае требуется удалить редирект и оповестить систему про обновление.
- Ошибка. Файл сделан некорректно. Перейдите по ссылке Ошибка, где будут описаны ее причины. Исправьте все, что требует поисковик и далее сообщите о внесении изменений.
- Не проиндексирован. Сервер отправляет HTTP-код, который отличается от 200 ОК. Зайдите в инструмент Проверка ответа сервера и вставьте полный URL расположения карты сайта, чтобы убедиться, есть ли у поискового бота доступ к ней. Если файл недоступен, свяжитесь с администратором сервера или ресурса, где он размещен.

Также убедитесь, что в robots.txt вы не применили к файлу директиву Disallow, запрещающую его индексацию.
Обновление
При внесении каких-либо изменений в карту сайта нет необходимости удалять ее, а потом опять загружать, так как боты часто проверяют сайтмап на обновления и наличие ошибок. Рекомендуется лишь кликнуть по значку ручного обновления, что позволит ботам быстрее обойти файл.
На заметку. Количество попыток ручного обновления ограничено, поэтому используйте его с умом.
Применяя файл индекса Sitemap, лучше активировать обработку всех файлов, содержащихся в нем. Поисковая машина загрузит информацию в ближайшие три дня. Функция доступна 10 раз для одного хоста. Использовав все попытки, следующие 10 станут доступны через месяц – точная дата указывается.
Удаление
В панели вы также можете удалить файлы, которые ранее указали на странице «Файлы Sitemap»:
- Выберите веб-ресурс из списка.
- Напротив файла, который собираетесь исключить, кликните по значку «X».

Обязательно удалите директиву для Sitemap в robots.txt, если указывали ее. Потому что здесь она тоже отображается.

Вся информация о карте сайта будет исключена из базы данных поиска и панели Вебмастера на протяжении 2-3 недель.
Как добавить в Гугл Вебмастер
Аналогичным способом есть возможность сообщить о Sitemap и в Google Search Console.
Загрузка
- Зайдите в панель вебмастера Google.
- Найдите раздел «Сканирование», в нем перейдите в «Файлы Sitemap».
- Кликните «Добавление/Проверка файла».
- Введите адрес, по которому доступна карта сайта.
- Кликните «Отправить».
Если вы хотите проверить Sitemap на ошибки, рядом с кнопкой «Отправить» находится «Тест» – нажмите для проверки. После проверки отобразится окно с сообщением о наличии или отсутствии ошибок.
В справке Google можно ознакомиться со списком всех возможных ошибок и вариантов их решения.
Удаление
Если у вас новый интерфейс Search Console, напишите в поддержку поисковой системы.
Но наиболее оптимальный вариант – переключиться на старую версию внизу страницы. А дальше все как и в Яндекс.Вебмастер: переходите к выбору сайта из списка и затем напротив Sitemap ставите галочку для удаления файла.
Заключение
Тщательно продумайте, какие страницы вашего веб-ресурса самые приоритетные по отношению к другим, и указывайте их в файле Sitemap. Это эффективный инструмент, грамотное применение которого поможет роботам поисковых систем быстрее обходить сайт и получать информацию о его структуре.
Лучше всего использовать плагины и модули для различных CMS. Они автоматически создают карту сайта и дополняют ее ссылками при публикации нового контента, благодаря чему она всегда будет актуальной.
Вы там упомянули две популярные программы, с помощью которых можно сгенерировать карту сайта. Программы вроде бесплатные, но будут ли они автоматически обновлять sitemap? Не знаете ли?
Только плагины будут делать это автоматически