Przejdź do treści
Can AI see it

Sprawdź, co widzi AI. Zmierz, ile to warte.

Czym jest Siteimprove Crawl?

Krótka odpowiedź: Bot Siteimprove Crawl, obsługiwany przez Siteimprove, do analizy SEO i pakietu treści.

Operator: Siteimprove Typ: Narzędzie SEO Cel: Analiza SEO i pakietu treści

Bot Siteimprove Crawl jest używany w pakiecie treści Siteimprove, który obejmuje Quality Assurance, Accessibility, Policy i SEO. Przeszukuje witryny na portach 80 dla HTTP i 443 dla HTTPS. Bot używa określonych adresów IP i user-agentów do identyfikacji.

Identyfikacja User-Agent

Następujące ciągi user-agent identyfikują Siteimprove Crawl w logach Twojego serwera:

  • Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0) SiteCheck-sitecrawl

Reguły robots.txt dla Siteimprove Crawl

Respektuje robots.txt: Nie

Użyj poniższych reguł robots.txt, aby kontrolować dostęp Siteimprove Crawl:

# Block Siteimprove Crawl
User-agent: SiteimproveBot-Crawler
Disallow: /

# Allow Siteimprove Crawl
User-agent: SiteimproveBot-Crawler
Allow: /

Ten bot nie zobowiązuje się do przestrzegania robots.txt

Siteimprove Crawl oficjalnie nie przestrzega dyrektyw robots.txt. Jedynym niezawodnym sposobem kontroli dostępu jest blokowanie po stronie serwera (filtrowanie IP, reguły user-agent w konfiguracji serwera) w połączeniu z monitoringiem logów.

Potrzebujesz ciągłej weryfikacji ponad 500 botów? Can AI See It automatyzuje ten proces.

Zachowanie crawlera

Częstotliwość:Continuous

Wzorzec żądań:Crawls Run On Ports 80 For HTTP And 443 For HTTPS

Cytaty z oficjalnej dokumentacji

"This article provides details for the IP addresses and user-agent strings used by Siteimprove on your website."

Indeks aktywności crawlera

Względna aktywność crawlera Siteimprove Crawl w ciągu ostatnich 28 dni. Wyższe wartości oznaczają zwiększoną intensywność crawlowania w porównaniu z bazą okresu.

Pokaż dane aktywności (ostatnie 7 dni)
Data Indeks aktywności
Mar 26, 2026 88.0
Mar 27, 2026 82.7
Mar 28, 2026 83.1
Mar 29, 2026 81.8
Mar 30, 2026 87.3
Mar 31, 2026 90.2
Apr 1, 2026 88.8

Źródło: Cloudflare Radar

Dlaczego warto śledzić ruch Siteimprove Crawl?

Kontroluj wpływ crawlerów zewnętrznych na serwer. Siteimprove Crawl crawluje Twoją stronę dla bazy SEO Siteimprove. Choć przydatne dla analizy konkurencji, te crawlery mogą pochłaniać znaczne zasoby serwera na dużych stronach.

Identyfikuj, kto analizuje Twoją stronę. Wizyty Siteimprove Crawl ujawniają, gdy konkurenci lub agencje przeprowadzają audyty Twojej domeny.

Zarządzaj priorytetem crawlowania. Jeśli Siteimprove Crawl pochłania budżet crawlowania, który wolisz przydzielić wyszukiwarkom, możesz go ograniczyć lub zablokować na podstawie zmierzonego wolumenu.

Wykrywaj błędy 4XX i 5XX zanim znajdą je wyszukiwarki. Jeśli Siteimprove Crawl raportuje uszkodzone strony, możesz naprawić te problemy proaktywnie — zanim crawlery wyszukiwarek je napotkają i Twoje pozycje ucierpią.

Czy Siteimprove Crawl jest wart zasobów serwera?

Siteimprove Crawl crawluje Twoją stronę dla bazy SEO Siteimprove. W przeciwieństwie do wyszukiwarek, ten crawler nie odsyła ruchu polecającego — zasila narzędzie zewnętrzne.

To niekoniecznie problem — dane Siteimprove mogą zasilać narzędzia, z których sam korzystasz. Pytanie brzmi, czy wolumen crawlowania Siteimprove Crawl jest proporcjonalny do jego wartości.

Co mierzy Can AI See It

Wolumen crawlowania

Żądania dziennie i przepustowość zużywana przez Siteimprove Crawl

Udział zasobów

Jaki % całkowitego ruchu botów stanowi Siteimprove Crawl?

Wykrywanie fałszywych botów

Scrapery podszywające się pod user-agent Siteimprove Crawl

Weryfikacja w logach

Aby zweryfikować ruch Siteimprove Crawl w logach serwera:

  1. Szukaj w logach dostępu ciągów user-agent wymienionych powyżej
  2. Sprawdź, czy adresy IP pasują do udokumentowanych zakresów (jeśli podane przez Siteimprove)
  3. Zweryfikuj, czy wzorzec crawlowania odpowiada udokumentowanemu zachowaniu
  4. Użyj odwrotnego wyszukiwania DNS do dodatkowej weryfikacji, jeśli dostępne

Weryfikacja IP: Siteimprove udostępnia oficjalną weryfikację IP przez Published IP ranges. Zobacz instrukcje weryfikacji →

A text file containing all IP addresses is available for download

Note: Obserwowane zachowanie w środowiskach produkcyjnych może różnić się od oficjalnej dokumentacji. Monitoring logów serwera zapewnia jedyną niezawodną weryfikację rzeczywistego zachowania botów.

Nieudokumentowane informacje

Następujące informacje nie są oficjalnie udokumentowane dla Siteimprove Crawl:

  • crawl frequency details
  • JavaScript rendering details

Zobacz, które narzędzia SEO crawlują Twoją stronę — i ile to kosztuje

  • Identyfikuj crawlery zewnętrzne zużywające zasoby serwera
  • Oddzielaj ruch narzędzi SEO od crawli wyszukiwarek
  • Wykrywaj fałszywe boty podszywające się pod user-agent Siteimprove Crawl

Oficjalna dokumentacja

Zobacz oficjalną dokumentację Siteimprove Crawl →

Informacje pochodzą z oficjalnej dokumentacji. Treść wygenerowana z pomocą AI.