Czym jest Siteimprove Crawl?
Krótka odpowiedź: Bot Siteimprove Crawl, obsługiwany przez Siteimprove, do analizy SEO i pakietu treści.
Bot Siteimprove Crawl jest używany w pakiecie treści Siteimprove, który obejmuje Quality Assurance, Accessibility, Policy i SEO. Przeszukuje witryny na portach 80 dla HTTP i 443 dla HTTPS. Bot używa określonych adresów IP i user-agentów do identyfikacji.
Identyfikacja User-Agent
Następujące ciągi user-agent identyfikują Siteimprove Crawl w logach Twojego serwera:
Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0) SiteCheck-sitecrawl
Reguły robots.txt dla Siteimprove Crawl
Respektuje robots.txt: Nie
Użyj poniższych reguł robots.txt, aby kontrolować dostęp Siteimprove Crawl:
# Block Siteimprove Crawl
User-agent: SiteimproveBot-Crawler
Disallow: /
# Allow Siteimprove Crawl
User-agent: SiteimproveBot-Crawler
Allow: / Ten bot nie zobowiązuje się do przestrzegania robots.txt
Siteimprove Crawl oficjalnie nie przestrzega dyrektyw robots.txt. Jedynym niezawodnym sposobem kontroli dostępu jest blokowanie po stronie serwera (filtrowanie IP, reguły user-agent w konfiguracji serwera) w połączeniu z monitoringiem logów.
Potrzebujesz ciągłej weryfikacji ponad 500 botów? Can AI See It automatyzuje ten proces.
Zachowanie crawlera
Częstotliwość:Continuous
Wzorzec żądań:Crawls Run On Ports 80 For HTTP And 443 For HTTPS
Cytaty z oficjalnej dokumentacji
"This article provides details for the IP addresses and user-agent strings used by Siteimprove on your website."
Indeks aktywności crawlera
Względna aktywność crawlera Siteimprove Crawl w ciągu ostatnich 28 dni. Wyższe wartości oznaczają zwiększoną intensywność crawlowania w porównaniu z bazą okresu.
Pokaż dane aktywności (ostatnie 7 dni)
| Data | Indeks aktywności |
|---|---|
| Mar 26, 2026 | 88.0 |
| Mar 27, 2026 | 82.7 |
| Mar 28, 2026 | 83.1 |
| Mar 29, 2026 | 81.8 |
| Mar 30, 2026 | 87.3 |
| Mar 31, 2026 | 90.2 |
| Apr 1, 2026 | 88.8 |
Źródło: Cloudflare Radar
Dlaczego warto śledzić ruch Siteimprove Crawl?
Kontroluj wpływ crawlerów zewnętrznych na serwer. Siteimprove Crawl crawluje Twoją stronę dla bazy SEO Siteimprove. Choć przydatne dla analizy konkurencji, te crawlery mogą pochłaniać znaczne zasoby serwera na dużych stronach.
Identyfikuj, kto analizuje Twoją stronę. Wizyty Siteimprove Crawl ujawniają, gdy konkurenci lub agencje przeprowadzają audyty Twojej domeny.
Zarządzaj priorytetem crawlowania. Jeśli Siteimprove Crawl pochłania budżet crawlowania, który wolisz przydzielić wyszukiwarkom, możesz go ograniczyć lub zablokować na podstawie zmierzonego wolumenu.
Wykrywaj błędy 4XX i 5XX zanim znajdą je wyszukiwarki. Jeśli Siteimprove Crawl raportuje uszkodzone strony, możesz naprawić te problemy proaktywnie — zanim crawlery wyszukiwarek je napotkają i Twoje pozycje ucierpią.
Czy Siteimprove Crawl jest wart zasobów serwera?
Siteimprove Crawl crawluje Twoją stronę dla bazy SEO Siteimprove. W przeciwieństwie do wyszukiwarek, ten crawler nie odsyła ruchu polecającego — zasila narzędzie zewnętrzne.
To niekoniecznie problem — dane Siteimprove mogą zasilać narzędzia, z których sam korzystasz. Pytanie brzmi, czy wolumen crawlowania Siteimprove Crawl jest proporcjonalny do jego wartości.
Co mierzy Can AI See It
Żądania dziennie i przepustowość zużywana przez Siteimprove Crawl
Jaki % całkowitego ruchu botów stanowi Siteimprove Crawl?
Scrapery podszywające się pod user-agent Siteimprove Crawl
Weryfikacja w logach
Aby zweryfikować ruch Siteimprove Crawl w logach serwera:
- Szukaj w logach dostępu ciągów user-agent wymienionych powyżej
- Sprawdź, czy adresy IP pasują do udokumentowanych zakresów (jeśli podane przez Siteimprove)
- Zweryfikuj, czy wzorzec crawlowania odpowiada udokumentowanemu zachowaniu
- Użyj odwrotnego wyszukiwania DNS do dodatkowej weryfikacji, jeśli dostępne
Weryfikacja IP: Siteimprove udostępnia oficjalną weryfikację IP przez Published IP ranges. Zobacz instrukcje weryfikacji →
A text file containing all IP addresses is available for download
Note: Obserwowane zachowanie w środowiskach produkcyjnych może różnić się od oficjalnej dokumentacji. Monitoring logów serwera zapewnia jedyną niezawodną weryfikację rzeczywistego zachowania botów.
Nieudokumentowane informacje
Następujące informacje nie są oficjalnie udokumentowane dla Siteimprove Crawl:
- crawl frequency details
- JavaScript rendering details
Zobacz, które narzędzia SEO crawlują Twoją stronę — i ile to kosztuje
- Identyfikuj crawlery zewnętrzne zużywające zasoby serwera
- Oddzielaj ruch narzędzi SEO od crawli wyszukiwarek
- Wykrywaj fałszywe boty podszywające się pod user-agent Siteimprove Crawl
Oficjalna dokumentacja
Zobacz oficjalną dokumentację Siteimprove Crawl →
Informacje pochodzą z oficjalnej dokumentacji. Treść wygenerowana z pomocą AI.