Czym jest PrintFriendly?
Krótka odpowiedź: Wyodrębnia treść, aby wyświetlić wersję Print Friendly. Wydawcy zwykle osadzają nasz przycisk - https://www.printfriendly.com/button - aby ich użytkownicy mogli wyświetlić stronę Print Friendly i/lub utworzyć PDF
Identyfikacja User-Agent
Następujące ciągi user-agent identyfikują PrintFriendly w logach Twojego serwera:
PrintFriendly.com
Reguły robots.txt dla PrintFriendly
Respektuje robots.txt: Nie
Ten bot nie zobowiązuje się do przestrzegania robots.txt
PrintFriendly oficjalnie nie przestrzega dyrektyw robots.txt. Jedynym niezawodnym sposobem kontroli dostępu jest blokowanie po stronie serwera (filtrowanie IP, reguły user-agent w konfiguracji serwera) w połączeniu z monitoringiem logów.
Potrzebujesz ciągłej weryfikacji ponad 500 botów? Can AI See It automatyzuje ten proces.
Dlaczego warto śledzić ruch PrintFriendly?
Identyfikuj i klasyfikuj nieznaną aktywność crawlerów. PrintFriendly może pojawiać się w logach serwera z różną częstotliwością. Śledzenie zachowania pomaga zdecydować, czy zezwolić, ograniczyć czy zablokować na podstawie danych.
Chroń budżet crawlowania. Każde żądanie bota pochłania zasoby serwera. Zrozumienie, co PrintFriendly crawluje, pomaga priorytetyzować crawlery, które mają znaczenie.
Weryfikacja w logach
Aby zweryfikować ruch PrintFriendly w logach serwera:
- Szukaj w logach dostępu ciągów user-agent wymienionych powyżej
- Sprawdź, czy adresy IP pasują do udokumentowanych zakresów (jeśli podane przez PrintFriendly.com)
- Zweryfikuj, czy wzorzec crawlowania odpowiada udokumentowanemu zachowaniu
- Użyj odwrotnego wyszukiwania DNS do dodatkowej weryfikacji, jeśli dostępne
Note: Obserwowane zachowanie w środowiskach produkcyjnych może różnić się od oficjalnej dokumentacji. Monitoring logów serwera zapewnia jedyną niezawodną weryfikację rzeczywistego zachowania botów.
Oficjalna dokumentacja
Zobacz oficjalną dokumentację PrintFriendly →
Informacje pochodzą z oficjalnej dokumentacji. Treść wygenerowana z pomocą AI.