Форум OlegON > Компьютеры и Программное обеспечение > Сеть > Создание сайтов и поисковая оптимизация (SEO)

Почему Google берет только одну ссылку из sitemap, игнорируя другие?

20.01.2021 1:26


06.11.2019 16:13
OlegON
 
В настоящий момент у Google есть проблема с обработкой содержимого файла sitemap, если в имени файла (пути к нему) есть символ подчеркивания.




Т.е. если у вас файл сайтмапа выглядит так: sitemap_index.xml.gz, то очень большая вероятность проблем с ним.

Поскольку официального объяснения этому глюку нет, нет и сроков, когда ожидать исправления, единственное проверенное средство для его обхода - избавиться от символа подчеркивания в url.

Обращаю внимание, что ошибка распространяется не только на индексный файл, но и все вложенные сайтмапы.
07.11.2019 17:45
OlegON
 
Небольшое дополнение : по многочисленным жалобам можно сделать вывод, что игнорирование части карты сайта происходит и с некоторых доменных зон (в том числе пуникодных и всяких .top и .club), а так же при каких-то непривычных именах файла, например, без расширения.

Обязательно проверяйте, что sitemap отдает тип данных вроде application/rss+xml; charset=UTF-8 (посмотреть можете здесь https://olegon.ru/page/)
23.02.2020 11:28
OlegON
 
Еще один интересный способ обхода проблемы, который некоторым помогает - добавлять сайтмап с дробью на конце, т.е. /sitemap.xml/
21.06.2020 12:27
OlegON
 
Из новостей по теме, несколько доменов с такими проблемами были связаны ключевыми словами, которые наводят на мысль, что некоторые домены фильтруются по имени. Скорее всего, в этом и есть гвоздь проблемы. Например, сайты для взрослых жалуются...
12.01.2021 01:14
Hikolay
 
Источник вставить не удалось (так от радости решил разместить)

У меня:
1 сайт на вордпресс
2 карта сайта sitemap.xml
3 в карте сайта url содежит нижнее подчеркивание
4 карта создана плагином XML Sitemap Generator for WordPress 4.1.0
5 2 года не идет индекс
6 хостинги и сервера разные пробовал


Цитата:
в robots.txt вставляем Sitemap: ваш сайт/sitemap.xml, в .htaccasess должно быть RewriteRule ^sitemap.xml$ index.php?route=extension/feed/google_sitemap [L] в вебмастере путь sitemap.xml

не знаю почему, но завелось
12.01.2021 01:36
Hikolay
 
Хоть и карта сайта была прочитана, остальные дочерние ссылки гугл не прочитал
по типу
Цитата:
sitemap-pt-post-2021-01.xml
sitemap-pt-post-2020-12.xml
12.01.2021 01:54
Hikolay
 
Короче я прогляделся - ничерта не помогает - даже редиректы и то что я писал выше - карта зеленым засветилась, но обработку гугл не делает
12.01.2021 21:30
OlegON
 
Я уже не один раз писал... Не используйте чужие плагины, в каком-то из сайтогенераторов вообще все ссылками на сайт автора было утыкано. Зачем?
Возьмите его за основу и напишите свой. Это несложно. И можно сделать, как сами захотите. В частности - убрать подчеркивания и прочее вообще.
Не надо никакие редиректы делать. Помимо общего утяжеления конфига, это еще и тормозов добавляет, особенно, если регекспы достаточно тяжелые или URI запрашиваемый длинный.
13.01.2021 23:05
OlegON
 
для начала, записи DNS - это DNS-сервера, хостинг - это где файлики лежат. Вещи не очень связанные. Чем метаться, сначала надо найти то, что мешает и там уже думать, что именно менять. Рваться и бегать по потолку, накручивая дополнительные проблемы - плохой вариант. Но вариант с тем, что хостинг в бане РКН, например, надо проверить... Только я ссылку дал ещё вчера, а мы пока без конкретной проблемы обсуждаем что-то...

Форум на базе vBulletin®
Copyright © Jelsoft Enterprises Ltd.
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.