Sitekit Sitemap-XML als externe Quelle Crawlen
Version vom 14. Januar 2021, 10:03 Uhr von Veltrup (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „Crawler-Einstellung um über die sitemapXml einer Sitekit-Site zu crawlern: Für einen Index muss eine neue externe(!) Quelle angelegt werden. Konfiguration:…“)
Crawler-Einstellung um über die sitemapXml einer Sitekit-Site zu crawlern:
Für einen Index muss eine neue externe(!) Quelle angelegt werden.
Konfiguration:
Crawler / Tiefe: 2 Die Tiefe ist wichtig damit nur der sitemapXml-Index und die sitemapXml-Url-Listen weiterverfolgt werden, die in den Url-Listen enthaltenen URL's sollen nicht weiter verfolgt werden.
Start URL's
https://my.domain.de/?sp:out=sitemap
Die Start-URL muss den sitemapXml-Index zurück liefern
URL-Filter
https://my.domain.de/.*
URL-Normalizer
(X) Den Welcome-Normalizer verwenden
(X) Den Standard-Url-Normalizer verwenden
(X) Den Url-Paramter Normalizer verwenden
Die Liste der erlaubten URL-Parameter:
sp:out=sitemap sp:page