Четыре распространенные проблемы, обнаруженные в картах сайта XML, и способы их устранения

Опубликовано: 2022-10-26


Каковы общие проблемы, обнаруженные в картах сайта XML? Какое влияние они оказывают и как их исправить?

Это то, что мы собираемся обсудить сегодня с женщиной, которая, когда она не работает над проектами или не пишет о SEO, тратит свое время на выращивание помидоров, перцев и трав. Недавно ее наставляла Алейда Солис и Коалиция фрилансеров за техническое SEO-наставничество в развивающихся странах. А также в качестве внештатного подрядчика и основателя Tech SEO Journal. Добро пожаловать в подкаст In Search SEO, Кэтрин Нванору.

В этом эпизоде ​​Кэтрин рассказывает о четырех распространенных проблемах с XML-картой сайта и о том, как их исправить, в том числе:
  • Список недопустимых URL-адресов
  • Ошибка неподдерживаемого формата HTML
  • Неверное объявление страницы и ее альтернативной версии
  • Наличие одной карты сайта большего размера для отдельных разделов веб-сайта

Кэтрин: Привет, Дэвид. Спасибо, что пригласили меня.

Д: Привет, Кэтрин. Здорово, что ты здесь. Вы можете найти Кэтрин на сайте techseojournal.com. Итак, Кэтрин, почему XML-карты сайта так важны?

К.: Хороший вопрос. Для меня есть два основных преимущества наличия XML-карты сайта. Во-первых, это помогает поисковым системам находить важные страницы. Если вы имеете дело с небольшим веб-сайтом, имеющим 500 страниц или менее, хорошей внутренней структурой ссылок и страницами, которые не часто меняются, то в этом случае карта сайта в формате XML не является вашим приоритетом. Но если вы имеете дело с более крупными веб-сайтами, где у вас есть часто меняющийся контент, плохая внутренняя структура ссылок и страницы-сироты, то иметь карту сайта имеет смысл, поскольку она может помочь поисковым системам найти ваши важные страницы.

Но я также хотел бы отметить, что наличие XML-карты сайта не гарантирует индексацию. Это больше похоже на подсказку, подсказку для поисковых систем. Это все равно, что сказать Google: «Эй, у меня есть очень классные страницы, которые, я думаю, должны быть проиндексированы. Не могли бы вы взглянуть на них?»

Второе преимущество наличия XML-карты сайта заключается в том, что она помогает устранять проблемы с SEO, особенно проблемы с индексацией. Но я вернусь к этому.

D: Отлично, теперь вы сказали для более крупных сайтов. Вы имеете в виду определенное количество страниц, где, если на сайте более определенного количества страниц, рекомендуется использовать XML-карту сайта?

K: Документация Google рекомендует 500 страниц или более, в отличие от меньшего веб-сайта. Но в большинстве случаев вполне достаточно 1000 страниц и более.

Д.: Замечательно иметь точные цифры, на которых можно сосредоточиться. Итак, сегодня вы рассказываете о четырех распространенных проблемах с XML-картами сайта. Начиная с номера один, перечисляя недопустимые URL-адреса.



1. Список недопустимых URL-адресов



K: Да, и под неприемлемыми URL-адресами я подразумеваю URL-адреса, которые генерируют код ошибки 404. Возможно, они заблокированы robots.txt, или у них есть тег noindex, или они перенаправляются. Обычно это происходит в том случае, если вы, вероятно, создали карту сайта вручную, и каким-то образом эти страницы с ошибками попали в файл. Другая причина, по которой это происходит, заключается в том, что, возможно, вы создали XML-карту сайта, которая не обновляется автоматически, она статична. Поэтому, когда вы создаете новые страницы на своем веб-сайте, это не отражается на карте сайта. Это проблема, потому что вместо того, чтобы сканировать ваши действительные страницы, поисковые системы тратят время впустую, пытаясь получить доступ к вашему сильно перенаправленному контенту или страницам, на которые им не следует переходить. И Google упомянул, что если им не удастся просканировать карту сайта после нескольких попыток, они в конечном итоге прекратят попытки. Это в первую очередь противоречит цели наличия XML-карты сайта.

D: Таким образом, если вы сохраните недопустимые URL-адреса, включенные в вашу XML-карту сайта, то в конечном итоге Google просто проигнорирует вашу XML-карту сайта или, возможно, даже не будет доверять всему вашему веб-сайту как авторитетному. Это подводит нас ко второму пункту, когда карта сайта XML генерирует ошибку неподдерживаемого формата HTML.



2. Ошибка неподдерживаемого формата HTML



K: Во-первых, я хотел бы описать, что такое HTML Sitemap. Файл Sitemap в формате HTML — это его содержимое, ссылки на ваши страницы и разделы вашего веб-сайта. Обычно он предназначен для пользователей-людей для навигации по вашему сайту. Он находится в нижнем колонтитуле вашего сайта. И да, в большинстве случаев поисковые системы также могут перейти по этим ссылкам, чтобы найти ваши страницы. Но на этом сходство с XML-картой сайта заканчивается. Карта сайта в формате HTML не имеет даты изменения. Если у вас есть видео, возможно, вы даже не сможете связать эти видео с картой сайта HTML.

Если вы действительно хотите сообщить поисковым системам о своем существующем и обновленном контенте, вам следует придерживаться XML-карты сайта. Но в случае, когда вы пытаетесь отправить XML-карту сайта и получаете эту ошибку в формате HTML, скорее всего, вы на самом деле отправляете файл в формате HTML, или ваша карта сайта содержит ошибки, которые затрудняет чтение.

Другая распространенная причина, почему это происходит, заключается в том, что на вашем веб-сайте есть функция кэширования, когда плагин, сервер или конфигурация мешают и вместо этого обслуживают файл в формате HTML.

D: Там тоже отличные советы. Есть ли какие-то преимущества в том, чтобы когда-либо одновременно иметь карту сайта в формате HTML и карту сайта в формате XML, или будет достаточно карты сайта в формате XML?

К. Есть преимущества в том, чтобы иметь и то, и другое. Если вы можете получить дополнительную ценность в чем-то, почему бы и нет? Если ваши страницы имеют очень большую глубину сканирования, где некоторые страницы труднодоступны, то, возможно, карта сайта в формате HTML может помочь вам направить пользователей на страницы, на которые они должны попасть, и помочь им перемещаться по вашему веб-сайту. С другой стороны, XML-карта сайта предназначена для поисковых систем. Итак, в этом случае вы рассматриваете как пользователей, так и поисковые роботы. Так что да, это определенно хорошая идея иметь оба.

D: И вы, очевидно, говорили о важности правильного кодирования XML-карты сайта. Есть ли где-нибудь, что вы рекомендуете проверить, чтобы убедиться, что ваши XML-файлы Sitemap закодированы правильно?

K: Да, если вы беспокоитесь, что ваша XML-карта сайта может быть HTML-файлом, попробуйте отправить ее в Google Search Console. Скорее всего, вы получите ответ, что это карта сайта в формате HTML. И когда это произойдет, чтобы выяснить, что на самом деле вызывает это, откройте XML-карту сайта в своем браузере и проверьте страницу с помощью инструментов разработчика Chrome. Если есть плагин или кэширование сервера, вы, скорее всего, увидите список вещей, которые мешают. Как только вы обнаружите, что есть функция кэширования, вы можете изменить свои конфигурации, очистить кеш, и все вернется на круги своя. Но если вы не видите, что какие-либо функции кэширования мешают, то, скорее всего, у вас есть ошибки. И в этом случае вам нужно будет использовать валидатор карты сайта XML, чтобы проверить, есть ли ошибки или неправильно закодированные атрибуты в вашей карте сайта.

Д: Великолепно. И если ваша XML-карта сайта закодирована правильно, если это правильный XML, есть ли опасность того, что подключаемый модуль кэширования заморозит вашу XML-карту сайта, чтобы она не обновлялась правильно? Или это не опасно для файла XML?

К. Это опасность. Вот почему я рекомендовал вам убедиться, что в плагине нет кэширования. Во многих плагинах есть настройка, в которой вы можете кэшировать свои карты сайта, но вы не должны этого делать, так как это может вызвать проблемы, как я уже упоминал. Это может привести к тому, что карта сайта XML появится в виде HTML-файла. Это может привести к большому количеству ошибок, поэтому лучше не кэшировать XML-карту сайта. Пожалуйста, не надо. Просто лучше этого не делать.

D: И номер три — неправильное объявление страницы и ее альтернативной версии.



3. Неправильное объявление страницы и ее альтернативной версии



K: Это относится к случаю, когда вы внедряете тег hreflang в карту сайта XML. И в этом случае вам нужно указать URL-адрес, который вы хотите проиндексировать, и его альтернативные версии, включая себя. Например, допустим, у меня есть страница для англоговорящих на моем сайте, и я хочу, чтобы она была проиндексирована. Но при этом у меня есть две альтернативные версии. У меня есть немецкая версия для говорящих в Швейцарии и китайская версия для китайских пользователей. Поэтому для этого я бы указал URL-адрес страницы на английском языке, а затем перечислил бы эти три версии. Есть немецкая версия для Швейцарии, китайская версия для Китая и сама английская версия.

И эти теги взаимны. Поэтому, если каждая альтернативная версия, на которую ссылаются, не указывает на другую, возникает проблема. В вашей XML-карте сайта могут возникать проблемы, когда ваши теги hreflang интерпретируются неправильно или полностью игнорируются.

Д.: И это подводит нас к четвертому пункту, который заключается в наличии одной карты сайта большего размера для отдельных разделов веб-сайта.



4. Наличие одной карты сайта большего размера для отдельных разделов веб-сайта



К: Верно. В настоящее время Google поддерживает 50 000 URL-адресов в одной карте сайта или размер карты сайта не более 50 МБ без сжатия, в зависимости от того, что вы нажмете первым. Это не означает, что если у вас есть 50 000 URL-адресов, вы должны перечислить их все на одной странице. Это не очень хорошая практика, потому что это может затруднить устранение неполадок. Вы понятия не имеете, какие разделы вашего веб-сайта имеют проблемы с индексацией или сканированием, разделы, в которые поисковые системы и сканеры не попадают.

В идеале вы должны сегментировать карты сайта по разделам. Например, если у вас есть веб-сайт электронной коммерции, вы можете создать одну карту сайта для своих статических страниц (О нас, условия и т. д.), а затем разные карты сайта для страниц категорий. Таким образом, вы можете легко обнаружить проблемы и отфильтровать в отраслевых отчетах в Google Search Console разделы вашего веб-сайта, которые не сканируются и не индексируются должным образом.

D: Существует ли максимальное количество файлов Sitemap для вашего сайта?

K: На данный момент я не могу назвать это числом.

D: Как насчет регулярной проверки и диагностики ваших XML-карт сайта? Есть ли что-то, что вы должны проверять на наличие ошибок раз в месяц?

K: Я бы не рекомендовал раз в месяц. Если вы действительно хотите знать, что происходит на вашем веб-сайте, вы должны проверить свою консоль поиска Google, потому что именно там вы можете увидеть эти ошибки для карты сайта. Вы должны проверять его периодически, ежедневно, если можете, или еженедельно, в зависимости от количества публикуемых страниц. Если вы публикуете контент каждый божий день, то имеет смысл часто его проверять. Но если ваши страницы редко меняются, то еженедельно будет нормально. Но, пожалуйста, вы должны это проверить.

D: Люди, читающие, слушающие или наблюдающие за этим, думают, что мне нужно больше разбираться в картах сайта XML. Есть ли какие-либо ресурсы, которые вы можете порекомендовать людям, чтобы узнать больше о картах сайта XML?

К: Да. Вы должны проверить документацию Google. У них есть обширная документация о том, что такое карта сайта XML, как ее создать, лучшие практики и как управлять ею для многоязычных сайтов. Почти вся информация, которую вы можете найти, есть там.





Рассол Парето — наличие хорошей внутренней структуры ссылок



Д: Превосходно. Давайте закончим рассолом Парето. Парето говорит, что вы можете получить 80% результатов, прилагая 20% усилий. Какое SEO-направление вы бы порекомендовали, чтобы получить невероятные результаты при скромных усилиях?

K: Я бы сказал, хорошая внутренняя структура ссылок. Это потому, что это основной источник обнаружения URL для поисковых систем. Они могут переходить по ссылкам на вашем сайте, чтобы попасть на важные страницы вашего сайта. Кроме того, вы также можете использовать ссылки для передачи ценности SEO другим страницам. Или вы также можете использовать его, чтобы указать относительную важность страницы по сравнению с другими и отношения между вашими страницами. Так что да, лучше всего использовать хорошую структуру внутренних ссылок.

Д.: Значит, наличие хорошей внутренней структуры ссылок не означает, что XML-карты сайта не нужны?

К: Не совсем. Как я уже упоминал, если у вас хорошая внутренняя ссылочная структура и небольшой веб-сайт, XML-карта сайта не является приоритетом. Но некоторые сайты могут увидеть больше пользы от XML-карты сайта, чем другие. Если у вас действительно большие страницы, у вас может быть хорошая внутренняя структура ссылок, но кто не хочет большей ценности? Кто не хочет, чтобы поисковые системы вовремя попадали на его страницы? Таким образом, XML-карта сайта — это своего рода второстепенная мера предосторожности, которую вы принимаете, в то время как хорошая внутренняя структура ссылок — это первичный шаг, который вы предпринимаете.

D: Нужен ли файл Sitemap в формате HTML, если у вас есть хорошие внутренние ссылки?

K: Если у пользователей по-прежнему возникают проблемы с переходом на ваш веб-сайт, тогда имеет смысл использовать карту сайта в формате HTML.

Д: Понятно. Поэтому, если у вас есть проблемы с ранжированием URL-адресов или, возможно, с навигацией, как вы говорите, то карта сайта в формате HTML может быть полезна как для пользователей, так и для поисковых систем. Но если все страницы, которые вы хотите проиндексировать, уже проиндексированы, то нет необходимости в HTML-карте сайта.

К: Да, не нужно. Это хорошо иметь в этом случае, но не обязательно.

D: Ну, я был вашим хозяином, Дэвид Бэйн. Вы можете найти Кэтрин на сайте techseojournal.com. Кэтрин, большое спасибо за участие в подкасте In Search SEO.

К: Спасибо, что ты у меня есть. Было приятно.

Д: И спасибо, что выслушали. Ознакомьтесь со всеми предыдущими эпизодами и подпишитесь на бесплатную пробную версию платформы Rank Ranger на сайте rankranger.com.