Come trovo quando un URL è stato indicizzato per la prima volta da Google?


16

Come faccio a sapere quando un determinato URL è stato indicizzato per la prima volta da Google? Preferirei una soluzione che funzioni anche per gli URL dei concorrenti che non sono di mia proprietà.


1
È possibile che la risposta sia "no". Google potrebbe anche non archiviare queste informazioni (poiché non esiste un motivo particolare per cui dovrebbero farlo) o, anche se lo fanno, potrebbero non esporle a terzi.
Ilmari Karonen,

1
Come altri hanno già detto, non è possibile ottenere queste informazioni. Se hai accesso ai registri del server, potresti vedere quando è stato sottoposto a scansione per la prima volta, ma anche ciò non significa che sia stato indicizzato.
John Mueller,

Risposte:


15

Per conoscere l'età di un URL puoi seguire questo link sostituendolo www.example.comcon l'URL che desideri:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

Ad esempio, ecco il risultato di Google per il sito Meta di Stack Overflow : inserisci qui la descrizione dell'immagine

Altrimenti, anche la macchina Wayback è una buona soluzione ma meno precisa dalla mia esperienza.


3
Questa funzione di Google è disponibile anche in inglese? Ti sei collegato alla versione francese.
Stephen Ostermiller

1
@StephenOstermiller Basta cambiare il tld da .fra .com.
MDMoore313,

2
@Zistoloen +1 per la tua risposta, ma ho dubbi sulla tua domanda. Come hai detto, ho cercato www.stackexchange.com usando la tua query di esempio ma non mostra alcun risultato. Ho cercato rimuovendo wwwanche in questo momento sta mostrando il risultato per data Dec 1, 2014che è una data molto recente che non può essere l'età dell'URL. Sto cercando in modo errato? o manca qualcosa?
Sathiya Kumar,

2
Ho "rubato" questa risposta e l'ho aggiunta alla mia risposta con una spiegazione migliore. Questo è un grande trucco, Zistoloen.
Stephen Ostermiller

6
@Stephen & Zistoloen: generalmente non è la data in cui la pagina è stata indicizzata per la prima volta da Google. Sulla base di alcuni test, la data mostrata tramite questo metodo sembra essere estratta dal contenuto della pagina (se Google pensa di vedere qualcosa che assomiglia a una data "pubblicata il" o "ultima modifica il") o, se non tale la data si trova nei contenuti, in base alla data in cui Google ha osservato l'ultima volta (sostanziale?) modifica della pagina. Naturalmente, se la pagina non è mai stata cambiata dopo la sua prima pubblicazione, potrebbe accadere che sia la stessa della data di pubblicazione, ma non è garantito.
Ilmari Karonen,

8

Zistoloen ha trovato un modo per far visualizzare a Google la data in cui indicizzava per la prima volta il contenuto della pagina. Lo sto aggiungendo anche alla mia risposta perché penso di poterlo spiegare più chiaramente.

  1. Cerca su Google qualcosa che porti in primo piano la pagina che desideri
  2. Usa "Strumenti di ricerca"
  3. Seleziona "Intervallo personalizzato ..." dal menu a discesa "In qualsiasi momento"
  4. Inserisci un intervallo di date ampio come 1/1/1900 e 1/1/2020

Google mostrerà quindi la data in cui ha scoperto il contenuto presente nella pagina nei risultati della ricerca.

prima indicizzato

Se la pagina viene aggiornata con nuovi contenuti, Google aggiorna anche questa data. Quindi è più una data di "indicizzazione iniziale di questo contenuto" piuttosto che di "prima indicizzazione di questo URL".


La cache di Google per una pagina mostra quando la pagina è stata indicizzata l'ultima volta. Puoi vedere che la home page di Stack Exchange è stata indicizzata l'ultima volta oggi:

inserisci qui la descrizione dell'immagine


Un'altra opzione è utilizzare la macchina Wayback di Internet Archive . Questo ti mostra come appariva una pagina in passato. Puoi capire quando sono state pubblicate le pagine per la prima volta. Sia Google che Internet Archive eseguono la scansione e utilizzano la pagina poco dopo la sua prima pubblicazione.


1
La tua prima opzione darà il risultato esatto per tutti gli URL? Ho cercato bing.com come hai spiegato, ma non ho ottenuto la prima data indicizzata di bing.com. Scusa se sbaglio?
Sathiya Kumar,

1
Sembra essere accurato fintanto che il contenuto della pagina non è cambiato. Google può ripristinare questa data se la pagina viene revisionata. La mia homepage è elencata come 1 febbraio 2002 anche se una pagina interna è elencata come 1 febbraio 2001. La home page è stata ridisegnata in quel periodo mentre la pagina interna non è cambiata sostanzialmente dal 2001.
Stephen Ostermiller

@SathiyaKumar Bing.com dà la data del 19 marzo 2014 per me usando questo metodo. Si noti che tutto ciò che non è indicizzato da google (tramite robots.txt o altro) ovviamente non verrà mostrato in questo modo.
Thebluefish

4

Potrebbe non esserci alcun modo per scoprire quando una pagina web arbitraria è stata indicizzata per la prima volta da Google - certamente non conosco alcun modo per farlo. È possibile che Google semplicemente non memorizzi tali informazioni, poiché non esiste un motivo reale per cui dovrebbero farlo. Inoltre, anche se memorizzano queste informazioni, in realtà non hanno alcun motivo particolare per renderle liberamente disponibili a terzi.

(Se è la tua pagina e hai accesso ai vecchi registri di accesso al server web, è facile: basta cercare nei registri la prima visita da Googlebot a quella pagina. Ma altrimenti potrebbe non esserci modo di dirlo con certezza.)


In ogni caso, il metodo descritto da Zistoloen e Stephen Ostermiller nelle loro risposte non non generalmente rivelare la data in cui un particolare URL è stato indicizzato da Google prima. Piuttosto, mostra la data in cui Google pensa che il contenuto dell'URL sia stato pubblicato o aggiornato l'ultima volta e si basa spesso sui tentativi più o meno affidabili di Google di "annusare" le date dal contenuto della pagina stessa.

In questo video , Matt Cutts di Google accenna brevemente a come vengono scelte queste date. Per comodità, ho trascritto il pezzo rilevante del video (approssimativamente dalle 2:09 alle 2:22) di seguito:

"... spesso vedrai la data, quando la deduciamo, o quando l'abbiamo vista per la prima volta, ogni volta che abbiamo scansionato quella pagina, o se possiamo trovarla da qualche parte sulla pagina e possiamo estrarre quella data, tu ' Lo vedrò proprio all'inizio dello snippet. "

Per pagine come post di blog, pagine wiki o domande di scambio di stack, in cui il sito in esecuzione di software riporta automaticamente una data di creazione / modifica accurata sulla pagina stessa, è probabile che la data indicata da Google corrisponda ad essa. Per altri tipi di pagine, tuttavia, lo sniffer di data di Google deve lavorare di più e non sempre funziona correttamente (qualunque cosa "giusto" possa significare, in questo contesto).

In particolare, queste date sono sostanzialmente inutili per determinare quanto tempo fa una pagina è stata indicizzata , per due motivi:

  • Se una pagina è stata modificata di recente e la data di modifica è visualizzata in modo ben visibile sulla pagina, Google potrebbe prenderla come "la data" della pagina, anche se la modifica era completamente banale.

    Ad esempio, questa pagina wiki piuttosto vecchia (che Archive.org ha indicizzato per la prima volta nel 2003 ) è attualmente datata da Google dal 10 novembre 2014 - la data in cui è stata modificata più di recente, come mostrato nella parte inferiore della pagina. Il cambiamento che è avvenuto in quella data? Basta rimuovere un singolo link dalla parte inferiore della pagina.

  • Al contrario, Google sembra essere felice di accettare "date di pubblicazione" molto vecchie se le trova sulla pagina, anche quelle che precedono il lancio del World Wide Web .

    Ad esempio, questa pagina su un vecchio concorso di programmazione è datata da Google al 15 settembre 1986, in realtà la data dell'evento descritta nella pagina. Allo stesso modo, questa pagina che documenta uno sciopero degli studenti nel 1970 è datata da Google al 10 maggio 1970 (la data di uno dei documenti scansionati sulla pagina) e, ancora più assurdamente, questa pagina del manuale di Linux è datata da Google al 4 novembre , 1989 (una data di esempio casuale utilizzata nella pagina).

    Puoi trovare molti altri esempi simili usando la ricerca personalizzata dell'intervallo di date descritta da Stephen e Zistoloen, ma impostando l'estremità superiore dell'intervallo, diciamo, il 6 agosto 1991 .


Bene, nella tua risposta ti sei opposto principalmente alle risposte di Stephen e Zistoloen ma non trovo alcuna risposta adeguata alla domanda di OP "Come faccio a trovare quando un URL è stato indicizzato per la prima volta da Google?" nella tua risposta !!
Sathiya Kumar,

Potrebbe non esserci alcuna risposta, a parte il fatto che "non puoi" o "nessuno sa come". Ma hai ragione, permettimi di modificarlo nella mia risposta.
Ilmari Karonen,

@llmariKaronen +1 per la modifica e l'aggiunta della risposta alla domanda effettiva di OP.
Sathiya Kumar,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.