Czym jest TermlyBot?
Krótka odpowiedź: TermlyBot to web crawler obsługiwany przez Termly do wykrywania i kategoryzowania plików cookie na stronach internetowych.
TermlyBot to web crawler zaprojektowany do automatycznego wykrywania i kategoryzowania plików cookie na stronach internetowych. Jest obsługiwany przez Termly i używa określonych user-agentów do identyfikacji. Główną funkcją bota jest skanowanie stron internetowych w poszukiwaniu informacji o plikach cookie.
Identyfikacja User-Agent
Następujące ciągi user-agent identyfikują TermlyBot w logach Twojego serwera:
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Safari/537.36 (compatible; TermlyBot/W.X; +http://www.termly.io/bot.html)
Reguły robots.txt dla TermlyBot
Respektuje robots.txt: Nie
Ten bot nie zobowiązuje się do przestrzegania robots.txt
TermlyBot oficjalnie nie przestrzega dyrektyw robots.txt. Jedynym niezawodnym sposobem kontroli dostępu jest blokowanie po stronie serwera (filtrowanie IP, reguły user-agent w konfiguracji serwera) w połączeniu z monitoringiem logów.
Potrzebujesz ciągłej weryfikacji ponad 500 botów? Can AI See It automatyzuje ten proces.
Zachowanie crawlera
Częstotliwość:Not Documented
Wzorzec żądań:Mozilla/5.0 (X11; Linux X86 64) AppleWebKit/537.36 (KHTML, Like Gecko) Chrome/W.X.Y.Z Safari/537.36 (Compatible; TermlyBot/W.X; +Http://Www.Termly.Io/Bot.Html)
Cytaty z oficjalnej dokumentacji
"TermlyBot is a web crawler that allows you to detect and categorize the cookies on your website automatically."
Dlaczego warto śledzić ruch TermlyBot?
Odróżniaj ruch monitorujący od rzeczywistej aktywności crawlerów. TermlyBot sprawdza dostępność Twojej strony w regularnych interwałach. Bez właściwej identyfikacji te żądania mogą zawyżać metryki ruchu botów.
Weryfikuj pokrycie monitoringu. Śledź, które strony TermlyBot sprawdza i jak często, aby konfiguracja monitoringu odpowiadała wymaganiom infrastruktury.
Weryfikacja w logach
Aby zweryfikować ruch TermlyBot w logach serwera:
- Szukaj w logach dostępu ciągów user-agent wymienionych powyżej
- Sprawdź, czy adresy IP pasują do udokumentowanych zakresów (jeśli podane przez Termly)
- Zweryfikuj, czy wzorzec crawlowania odpowiada udokumentowanemu zachowaniu
- Użyj odwrotnego wyszukiwania DNS do dodatkowej weryfikacji, jeśli dostępne
Note: Obserwowane zachowanie w środowiskach produkcyjnych może różnić się od oficjalnej dokumentacji. Monitoring logów serwera zapewnia jedyną niezawodną weryfikację rzeczywistego zachowania botów.
Nieudokumentowane informacje
Następujące informacje nie są oficjalnie udokumentowane dla TermlyBot:
- crawl frequency
- IP verification
- JavaScript rendering
Oficjalna dokumentacja
Zobacz oficjalną dokumentację TermlyBot →
Informacje pochodzą z oficjalnej dokumentacji. Treść wygenerowana z pomocą AI.