Zum Hauptinhalt springen
Can AI see it

Erfahre, was KI sieht. Miss, was es wert ist.

Was ist Siteimprove Crawl?

Kurzantwort: Siteimprove Crawl bot, betrieben von Siteimprove, für die Analyse von SEO- und Content-Suite.

Betreiber: Siteimprove Typ: SEO-Tool Zweck: Analyse von SEO- und Content-Suite

Der Siteimprove Crawl bot wird für die Content-Suite von Siteimprove verwendet, die Quality Assurance, Accessibility, Policy und SEO umfasst. Er crawlt Websites auf Port 80 für HTTP und 443 für HTTPS. Der bot verwendet bestimmte IP-Adressen und user agents, um sich zu identifizieren.

User-Agent-Identifikation

Die folgenden User-Agent-Strings identifizieren Siteimprove Crawl in Ihren Live-Traffic-Daten:

  • Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0) SiteCheck-sitecrawl

robots.txt-Regeln für Siteimprove Crawl

Respektiert robots.txt: Nein

Verwenden Sie die folgenden robots.txt-Regeln, um den Zugriff von Siteimprove Crawl zu steuern:

# Block Siteimprove Crawl
User-agent: SiteimproveBot-Crawler
Disallow: /

# Allow Siteimprove Crawl
User-agent: SiteimproveBot-Crawler
Allow: /

Dieser Bot verpflichtet sich nicht, robots.txt zu befolgen

Siteimprove Crawl befolgt robots.txt-Anweisungen nicht offiziell. Die einzige zuverlässige Methode zur Zugriffskontrolle ist serverseitiges Blockieren (IP-Filterung, User-Agent-Regeln in Ihrer Webserver-Konfiguration) in Kombination mit Log-Monitoring zur Wirksamkeitsüberprüfung.

Benötigen Sie kontinuierliche Verifizierung für über 500 Bots? Can AI See It automatisiert dies.

Crawl-Verhalten

Häufigkeit:Continuous

Anfragemuster:Crawls Run On Ports 80 For HTTP And 443 For HTTPS

Zitate aus der offiziellen Dokumentation

"This article provides details for the IP addresses and user-agent strings used by Siteimprove on your website."

Crawl-Aktivitätsindex

Relative Crawl-Aktivität von Siteimprove Crawl der letzten 28 Tage. Höhere Werte zeigen eine erhöhte Crawl-Intensität im Vergleich zum Basiszeitraum an.

Aktuelle Aktivitätsdaten anzeigen (letzte 7 Tage)
Datum Aktivitätsindex
Mar 26, 2026 88.0
Mar 27, 2026 82.7
Mar 28, 2026 83.1
Mar 29, 2026 81.8
Mar 30, 2026 87.3
Mar 31, 2026 90.2
Apr 1, 2026 88.8

Quelle: Cloudflare Radar

Warum Siteimprove Crawl-Traffic überwachen?

Kontrollieren Sie die Server-Auswirkungen durch Drittanbieter-Crawling. Siteimprove Crawl crawlt Ihre Website, um die SEO-Datenbank von Siteimprove aufzubauen. Obwohl nützlich für Wettbewerbsanalysen, können diese Crawler auf großen Websites erhebliche Serverressourcen verbrauchen.

Identifizieren Sie, wer Ihre Website analysiert. Siteimprove Crawl-Besuche zeigen, wenn Wettbewerber oder Agenturen Audits auf Ihrer Domain durchführen.

Verwalten Sie die Crawl-Priorität. Wenn Siteimprove Crawl Crawl-Budget verbraucht, das Sie lieber Suchmaschinen zuweisen würden, können Sie es basierend auf gemessenem Volumen drosseln oder blockieren.

Decken Sie 4XX- und 5XX-Fehler auf, bevor Suchmaschinen sie finden. Wenn Siteimprove Crawl in seinen Crawl-Daten fehlerhafte Seiten oder Serverfehler meldet, können Sie diese Probleme proaktiv beheben — bevor Suchmaschinen-Crawler darauf stoßen und Ihre Rankings leiden.

Lohnt sich Siteimprove Crawl die Serverressourcen?

Siteimprove Crawl crawlt Ihre Website, um die SEO-Datenbank von Siteimprove aufzubauen. Anders als Suchmaschinen sendet Ihnen dieser Crawler keinen Referral-Traffic — er speist ein Drittanbieter-Tool.

Das ist nicht unbedingt ein Problem — die Daten von Siteimprove können Tools unterstützen, die Sie selbst nutzen. Die Frage ist, ob das Crawl-Volumen von Siteimprove Crawl in einem angemessenen Verhältnis zum Nutzen steht.

Was Can AI See It misst

Crawl-Volumen

Anfragen pro Tag und von Siteimprove Crawl verbrauchte Bandbreite

Ressourcenanteil

Welchen Prozentsatz Ihres gesamten Bot-Traffics macht Siteimprove Crawl aus?

Fake-Bot-Erkennung

Scraper, die den User-Agent-String von Siteimprove Crawl fälschen

Log-Verifizierung

So verifizieren Sie Siteimprove Crawl-Traffic in Ihren Live-Traffic-Daten:

  1. Durchsuchen Sie Zugriffsprotokolle nach den oben aufgeführten User-Agent-Strings
  2. Prüfen Sie, ob die IP-Adressen mit dokumentierten Bereichen übereinstimmen (falls von Siteimprove bereitgestellt)
  3. Verifizieren Sie, ob das Crawl-Muster dem dokumentierten Verhalten entspricht
  4. Verwenden Sie Reverse-DNS-Lookup zur zusätzlichen Verifizierung, falls verfügbar

IP-Verifizierung: Siteimprove bietet eine offizielle IP-Verifizierung über Published IP ranges an. Verifizierungsanleitung anzeigen →

A text file containing all IP addresses is available for download

Note: Das beobachtete Verhalten in Produktionsumgebungen kann von der offiziellen Dokumentation abweichen. Live-Traffic-Monitoring bietet die einzige zuverlässige Verifizierung des tatsächlichen Bot-Verhaltens.

Undokumentierte Informationen

Die folgenden Informationen sind für Siteimprove Crawl nicht offiziell dokumentiert:

  • crawl frequency details
  • JavaScript rendering details

Sehen Sie, welche SEO-Tools Ihre Website crawlen — und was sie kosten

  • Drittanbieter-Crawler identifizieren, die Ihre Serverressourcen verbrauchen
  • SEO-Tool-Traffic von Suchmaschinen-Crawls trennen
  • Fake-Bots erkennen, die den User-Agent von Siteimprove Crawl fälschen

Offizielle Dokumentation

Offizielle Siteimprove Crawl-Dokumentation anzeigen →

Informationen stammen aus der offiziellen Dokumentation. Inhalt mit KI-Unterstützung erstellt.