Przejdź do treści
Can AI see it

Sprawdź, co widzi AI. Zmierz, ile to warte.

← Wróć do katalogu botów

Czym jest XY Archive Compliance Bot?

Krótka odpowiedź: XY Archive Compliance Bot to archiwizator witryn obsługiwany przez XY Archive Compliance dla klientów z wymaganiami zgodności archiwizacji.

Operator: XY Archive Compliance Typ: Inny bot Cel: Archiwizacja witryn na potrzeby zgodności

XY Archive Compliance Bot jest używany do archiwizacji witryn. Przeszukuje witrynę, aby określić, które strony nadają się do przechwycenia, a następnie wykonuje zrzuty ekranu zawartości każdej strony do archiwum. Żądania bota do witryny muszą być dozwolone, aby mógł prawidłowo zarchiwizować witrynę.

Identyfikacja User-Agent

Następujące ciągi user-agent identyfikują XY Archive Compliance Bot w logach Twojego serwera:

  • Mozilla/5.0 (compatible; XY-Archive-Compliance-Crawler; +https://archive.xyplanningnetwork.com/)
  • Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 (compatible; XY-Archive-Compliance-Archiver; +https://archive.xyplanningnetwork.com/)

Reguły robots.txt dla XY Archive Compliance Bot

Respektuje robots.txt: Nie

Użyj poniższych reguł robots.txt, aby kontrolować dostęp XY Archive Compliance Bot:

# Block XY Archive Compliance Bot
User-agent: XY-Archive-Compliance
Disallow: /

# Allow XY Archive Compliance Bot
User-agent: XY-Archive-Compliance
Allow: /

Ten bot nie zobowiązuje się do przestrzegania robots.txt

XY Archive Compliance Bot oficjalnie nie przestrzega dyrektyw robots.txt. Jedynym niezawodnym sposobem kontroli dostępu jest blokowanie po stronie serwera (filtrowanie IP, reguły user-agent w konfiguracji serwera) w połączeniu z monitoringiem logów.

Potrzebujesz ciągłej weryfikacji ponad 500 botów? Can AI See It automatyzuje ten proces.

Zachowanie crawlera

Częstotliwość:Not Documented

Wzorzec żądań:Not Documented

Cytaty z oficjalnej dokumentacji

"Requests by the Archiver to your website must be permitted for it to be able to archive your website properly"

Dlaczego warto śledzić ruch XY Archive Compliance Bot?

Identyfikuj i klasyfikuj nieznaną aktywność crawlerów. XY Archive Compliance Bot może pojawiać się w logach serwera z różną częstotliwością. Śledzenie zachowania pomaga zdecydować, czy zezwolić, ograniczyć czy zablokować na podstawie danych.

Chroń budżet crawlowania. Każde żądanie bota pochłania zasoby serwera. Zrozumienie, co XY Archive Compliance Bot crawluje, pomaga priorytetyzować crawlery, które mają znaczenie.

Weryfikacja w logach

Aby zweryfikować ruch XY Archive Compliance Bot w logach serwera:

  1. Szukaj w logach dostępu ciągów user-agent wymienionych powyżej
  2. Sprawdź, czy adresy IP pasują do udokumentowanych zakresów (jeśli podane przez XY Archive Compliance)
  3. Zweryfikuj, czy wzorzec crawlowania odpowiada udokumentowanemu zachowaniu
  4. Użyj odwrotnego wyszukiwania DNS do dodatkowej weryfikacji, jeśli dostępne

Note: Obserwowane zachowanie w środowiskach produkcyjnych może różnić się od oficjalnej dokumentacji. Monitoring logów serwera zapewnia jedyną niezawodną weryfikację rzeczywistego zachowania botów.

Nieudokumentowane informacje

Następujące informacje nie są oficjalnie udokumentowane dla XY Archive Compliance Bot:

  • crawl frequency
  • request pattern
  • JavaScript rendering details

Oficjalna dokumentacja

Zobacz oficjalną dokumentację XY Archive Compliance Bot →

Informacje pochodzą z oficjalnej dokumentacji. Treść wygenerowana z pomocą AI.