Jakie ciągi user-agent identyfikują Siteimprove Crawl?

Następujące ciągi user-agent identyfikują Siteimprove Crawl: Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0) SiteCheck-sitecrawl.

Czy Siteimprove Crawl respektuje reguły robots.txt?

Zgodnie z oficjalną dokumentacją Siteimprove Crawl nie respektuje reguł robots.txt.

Czy Siteimprove Crawl to legalny crawler?

Siteimprove Crawl jest operowany przez Siteimprove w celach analizy SEO. Weryfikuj legalne żądania sprawdzając ciągi user-agent i adresy IP źródłowe względem udokumentowanych zakresów Siteimprove.

Czym jest Siteimprove Crawl?

Q: Jak zweryfikować ruch Siteimprove Crawl w logach serwera?

Możesz zweryfikować żądania Siteimprove Crawl sprawdzając logi dostępu serwera pod kątem udokumentowanych ciągów user-agent. Dla dokładnej weryfikacji koreluj wzorce user-agent z zakresami IP lub metodami weryfikacji podanymi przez Siteimprove.

Krótka odpowiedź: Bot Siteimprove Crawl, obsługiwany przez Siteimprove, do analizy SEO i pakietu treści.

Operator: Siteimprove Typ: Narzędzie SEO Cel: Analiza SEO i pakietu treści

Bot Siteimprove Crawl jest używany w pakiecie treści Siteimprove, który obejmuje Quality Assurance, Accessibility, Policy i SEO. Przeszukuje witryny na portach 80 dla HTTP i 443 dla HTTPS. Bot używa określonych adresów IP i user-agentów do identyfikacji.

Identyfikacja User-Agent

Następujące ciągi user-agent identyfikują Siteimprove Crawl w logach Twojego serwera:

Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0) SiteCheck-sitecrawl

Reguły robots.txt dla Siteimprove Crawl

Respektuje robots.txt: Nie

Użyj poniższych reguł robots.txt, aby kontrolować dostęp Siteimprove Crawl:

# Block Siteimprove Crawl
User-agent: SiteimproveBot-Crawler
Disallow: /

# Allow Siteimprove Crawl
User-agent: SiteimproveBot-Crawler
Allow: /

Ten bot nie zobowiązuje się do przestrzegania robots.txt

Siteimprove Crawl oficjalnie nie przestrzega dyrektyw robots.txt. Jedynym niezawodnym sposobem kontroli dostępu jest blokowanie po stronie serwera (filtrowanie IP, reguły user-agent w konfiguracji serwera) w połączeniu z monitoringiem logów.

Potrzebujesz ciągłej weryfikacji ponad 500 botów? Can AI See It automatyzuje ten proces.

Zachowanie crawlera

Częstotliwość:Continuous

Wzorzec żądań:Crawls Run On Ports 80 For HTTP And 443 For HTTPS

Cytaty z oficjalnej dokumentacji

"This article provides details for the IP addresses and user-agent strings used by Siteimprove on your website."
Źródło:Oficjalna dokumentacja

Indeks aktywności crawlera

Względna aktywność crawlera Siteimprove Crawl w ciągu ostatnich 28 dni. Wyższe wartości oznaczają zwiększoną intensywność crawlowania w porównaniu z bazą okresu.

Pokaż dane aktywności (ostatnie 7 dni)

Data	Indeks aktywności
Mar 26, 2026	88.0
Mar 27, 2026	82.7
Mar 28, 2026	83.1
Mar 29, 2026	81.8
Mar 30, 2026	87.3
Mar 31, 2026	90.2
Apr 1, 2026	88.8

Źródło: Cloudflare Radar

Dlaczego warto śledzić ruch Siteimprove Crawl?

Kontroluj wpływ crawlerów zewnętrznych na serwer. Siteimprove Crawl crawluje Twoją stronę dla bazy SEO Siteimprove. Choć przydatne dla analizy konkurencji, te crawlery mogą pochłaniać znaczne zasoby serwera na dużych stronach.

Identyfikuj, kto analizuje Twoją stronę. Wizyty Siteimprove Crawl ujawniają, gdy konkurenci lub agencje przeprowadzają audyty Twojej domeny.

Zarządzaj priorytetem crawlowania. Jeśli Siteimprove Crawl pochłania budżet crawlowania, który wolisz przydzielić wyszukiwarkom, możesz go ograniczyć lub zablokować na podstawie zmierzonego wolumenu.

Wykrywaj błędy 4XX i 5XX zanim znajdą je wyszukiwarki. Jeśli Siteimprove Crawl raportuje uszkodzone strony, możesz naprawić te problemy proaktywnie — zanim crawlery wyszukiwarek je napotkają i Twoje pozycje ucierpią.

Czy Siteimprove Crawl jest wart zasobów serwera?

Siteimprove Crawl crawluje Twoją stronę dla bazy SEO Siteimprove. W przeciwieństwie do wyszukiwarek, ten crawler nie odsyła ruchu polecającego — zasila narzędzie zewnętrzne.

To niekoniecznie problem — dane Siteimprove mogą zasilać narzędzia, z których sam korzystasz. Pytanie brzmi, czy wolumen crawlowania Siteimprove Crawl jest proporcjonalny do jego wartości.

Co mierzy Can AI See It

Wolumen crawlowania

Żądania dziennie i przepustowość zużywana przez Siteimprove Crawl

Udział zasobów

Jaki % całkowitego ruchu botów stanowi Siteimprove Crawl?

Wykrywanie fałszywych botów

Scrapery podszywające się pod user-agent Siteimprove Crawl

Weryfikacja w logach

Aby zweryfikować ruch Siteimprove Crawl w logach serwera:

Szukaj w logach dostępu ciągów user-agent wymienionych powyżej
Sprawdź, czy adresy IP pasują do udokumentowanych zakresów (jeśli podane przez Siteimprove)
Zweryfikuj, czy wzorzec crawlowania odpowiada udokumentowanemu zachowaniu
Użyj odwrotnego wyszukiwania DNS do dodatkowej weryfikacji, jeśli dostępne

Weryfikacja IP: Siteimprove udostępnia oficjalną weryfikację IP przez Published IP ranges. Zobacz instrukcje weryfikacji →

A text file containing all IP addresses is available for download

Note: Obserwowane zachowanie w środowiskach produkcyjnych może różnić się od oficjalnej dokumentacji. Monitoring logów serwera zapewnia jedyną niezawodną weryfikację rzeczywistego zachowania botów.

Nieudokumentowane informacje

Następujące informacje nie są oficjalnie udokumentowane dla Siteimprove Crawl:

crawl frequency details
JavaScript rendering details

Zobacz, które narzędzia SEO crawlują Twoją stronę — i ile to kosztuje

Identyfikuj crawlery zewnętrzne zużywające zasoby serwera
Oddzielaj ruch narzędzi SEO od crawli wyszukiwarek
Wykrywaj fałszywe boty podszywające się pod user-agent Siteimprove Crawl

Zacznij mierzyć za darmo → Zobacz, jak to działa →

Oficjalna dokumentacja

Zobacz oficjalną dokumentację Siteimprove Crawl →

Informacje pochodzą z oficjalnej dokumentacji. Treść wygenerowana z pomocą AI.