Czym jest XY Archive Compliance Bot?
Krótka odpowiedź: XY Archive Compliance Bot to archiwizator witryn obsługiwany przez XY Archive Compliance dla klientów z wymaganiami zgodności archiwizacji.
XY Archive Compliance Bot jest używany do archiwizacji witryn. Przeszukuje witrynę, aby określić, które strony nadają się do przechwycenia, a następnie wykonuje zrzuty ekranu zawartości każdej strony do archiwum. Żądania bota do witryny muszą być dozwolone, aby mógł prawidłowo zarchiwizować witrynę.
Identyfikacja User-Agent
Następujące ciągi user-agent identyfikują XY Archive Compliance Bot w logach Twojego serwera:
Mozilla/5.0 (compatible; XY-Archive-Compliance-Crawler; +https://archive.xyplanningnetwork.com/)Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 (compatible; XY-Archive-Compliance-Archiver; +https://archive.xyplanningnetwork.com/)
Reguły robots.txt dla XY Archive Compliance Bot
Respektuje robots.txt: Nie
Użyj poniższych reguł robots.txt, aby kontrolować dostęp XY Archive Compliance Bot:
# Block XY Archive Compliance Bot
User-agent: XY-Archive-Compliance
Disallow: /
# Allow XY Archive Compliance Bot
User-agent: XY-Archive-Compliance
Allow: / Ten bot nie zobowiązuje się do przestrzegania robots.txt
XY Archive Compliance Bot oficjalnie nie przestrzega dyrektyw robots.txt. Jedynym niezawodnym sposobem kontroli dostępu jest blokowanie po stronie serwera (filtrowanie IP, reguły user-agent w konfiguracji serwera) w połączeniu z monitoringiem logów.
Potrzebujesz ciągłej weryfikacji ponad 500 botów? Can AI See It automatyzuje ten proces.
Zachowanie crawlera
Częstotliwość:Not Documented
Wzorzec żądań:Not Documented
Cytaty z oficjalnej dokumentacji
"Requests by the Archiver to your website must be permitted for it to be able to archive your website properly"
Indeks aktywności crawlera
Względna aktywność crawlera XY Archive Compliance Bot w ciągu ostatnich 28 dni. Wyższe wartości oznaczają zwiększoną intensywność crawlowania w porównaniu z bazą okresu.
Pokaż dane aktywności (ostatnie 7 dni)
| Data | Indeks aktywności |
|---|---|
| Mar 26, 2026 | 88.0 |
| Mar 27, 2026 | 82.7 |
| Mar 28, 2026 | 83.1 |
| Mar 29, 2026 | 81.8 |
| Mar 30, 2026 | 87.3 |
| Mar 31, 2026 | 90.2 |
| Apr 1, 2026 | 88.8 |
Źródło: Cloudflare Radar
Dlaczego warto śledzić ruch XY Archive Compliance Bot?
Identyfikuj i klasyfikuj nieznaną aktywność crawlerów. XY Archive Compliance Bot może pojawiać się w logach serwera z różną częstotliwością. Śledzenie zachowania pomaga zdecydować, czy zezwolić, ograniczyć czy zablokować na podstawie danych.
Chroń budżet crawlowania. Każde żądanie bota pochłania zasoby serwera. Zrozumienie, co XY Archive Compliance Bot crawluje, pomaga priorytetyzować crawlery, które mają znaczenie.
Weryfikacja w logach
Aby zweryfikować ruch XY Archive Compliance Bot w logach serwera:
- Szukaj w logach dostępu ciągów user-agent wymienionych powyżej
- Sprawdź, czy adresy IP pasują do udokumentowanych zakresów (jeśli podane przez XY Archive Compliance)
- Zweryfikuj, czy wzorzec crawlowania odpowiada udokumentowanemu zachowaniu
- Użyj odwrotnego wyszukiwania DNS do dodatkowej weryfikacji, jeśli dostępne
Note: Obserwowane zachowanie w środowiskach produkcyjnych może różnić się od oficjalnej dokumentacji. Monitoring logów serwera zapewnia jedyną niezawodną weryfikację rzeczywistego zachowania botów.
Nieudokumentowane informacje
Następujące informacje nie są oficjalnie udokumentowane dla XY Archive Compliance Bot:
- crawl frequency
- request pattern
- JavaScript rendering details
Oficjalna dokumentacja
Zobacz oficjalną dokumentację XY Archive Compliance Bot →
Informacje pochodzą z oficjalnej dokumentacji. Treść wygenerowana z pomocą AI.