Przejdź do treści
Can AI see it

Sprawdź, co widzi AI. Zmierz, ile to warte.

← Wróć do katalogu botów

Czym jest Google Publisher Center?

Krótka odpowiedź: Bot Google Publisher Center obsługiwany przez Google pobiera i przetwarza kanały dostarczane przez wydawców dla stron docelowych Google News.

Operator: Google Typ: Inny bot Cel: Pobieranie i przetwarzanie kanałów dostarczanych przez wydawców dla Google News

Bot Google Publisher Center to fetcher uruchamiany przez użytkownika, który pobiera i przetwarza kanały wyraźnie dostarczane przez wydawców do wykorzystania na stronach docelowych Google News. Jest obsługiwany przez Google i używa ciągu user agent 'GoogleProducer; (+https://developers.google.com/search/docs/crawling-indexing/google-producer)'. Jako fetcher uruchamiany przez użytkownika zazwyczaj ignoruje reguły robots.txt.

Identyfikacja User-Agent

Następujące ciągi user-agent identyfikują Google Publisher Center w logach Twojego serwera:

  • GoogleProducer; (+https://developers.google.com/search/docs/crawling-indexing/google-producer)

Reguły robots.txt dla Google Publisher Center

Respektuje robots.txt: Nie

Robots.txt ma ograniczony wpływ na boty inicjowane przez użytkowników

Google Publisher Center jest uruchamiany przez działania użytkowników w produktach Google. Mimo że Google deklaruje respektowanie robots.txt, bot działa inaczej niż autonomiczne crawlery — pobiera konkretne URL-e na żądanie zamiast systematycznie crawlować stronę. Monitoring logów serwera to jedyny niezawodny sposób weryfikacji.

Potrzebujesz ciągłej weryfikacji ponad 500 botów? Can AI See It automatyzuje ten proces.

Zachowanie crawlera

Częstotliwość:On-Demand

Wzorzec żądań:Requests URLs Provided By Publishers For Google News Landing Pages

Cytaty z oficjalnej dokumentacji

"Google Publisher Center fetches and processes feeds that publishers explicitly supplied for use in Google News landing pages."

Dlaczego warto śledzić ruch Google Publisher Center?

Identyfikuj i klasyfikuj nieznaną aktywność crawlerów. Google Publisher Center może pojawiać się w logach serwera z różną częstotliwością. Śledzenie zachowania pomaga zdecydować, czy zezwolić, ograniczyć czy zablokować na podstawie danych.

Chroń budżet crawlowania. Każde żądanie bota pochłania zasoby serwera. Zrozumienie, co Google Publisher Center crawluje, pomaga priorytetyzować crawlery, które mają znaczenie.

Weryfikacja w logach

Aby zweryfikować ruch Google Publisher Center w logach serwera:

  1. Szukaj w logach dostępu ciągów user-agent wymienionych powyżej
  2. Sprawdź, czy adresy IP pasują do udokumentowanych zakresów (jeśli podane przez Google)
  3. Zweryfikuj, czy wzorzec crawlowania odpowiada udokumentowanemu zachowaniu
  4. Użyj odwrotnego wyszukiwania DNS do dodatkowej weryfikacji, jeśli dostępne

Weryfikacja IP: Google udostępnia oficjalną weryfikację IP przez Published IP ranges. Zobacz instrukcje weryfikacji →

IP ranges are published in user-triggered-fetchers.json and user-triggered-fetchers-google.json

Note: Obserwowane zachowanie w środowiskach produkcyjnych może różnić się od oficjalnej dokumentacji. Monitoring logów serwera zapewnia jedyną niezawodną weryfikację rzeczywistego zachowania botów.

Nieudokumentowane informacje

Następujące informacje nie są oficjalnie udokumentowane dla Google Publisher Center:

  • crawl frequency details
  • JavaScript rendering details

Oficjalna dokumentacja

Zobacz oficjalną dokumentację Google Publisher Center →

Informacje pochodzą z oficjalnej dokumentacji. Treść wygenerowana z pomocą AI.