Ecco uno dei miei clienti, che esegue alcune azioni dopo aver effettuato l'accesso al suo account. Il token univoco è semplicemente un ID utente crittografato + data / ora.
94.254.xxx.xxx - - [02 / Jul / 2011: 22: 25: 46 +0200] "GET / some-action / unique-token-123abc HTTP / 1.1" 200 410 "-" "Mozilla / 5.0 (compatibile; MSIE 9.0; Windows NT 6.1; Trident / 5.0) "
Ora, Googlebot in qualche modo ha scoperto questo link unico e ha provato ad accedere allo stesso URL esatto una settimana dopo.
66.249.71.179 - - [10 / Jul / 2011: 09: 56: 01 +0200] "GET / some-action / unique-token-123abc HTTP / 1.1" 302 - "-" "Mozilla / 5.0 (compatibile; Googlebot / 2.1; + http: //www.google.com/bot.html) "
(il codice di stato è 302 perché il token era scaduto)
Vorrei sottolineare che si tratta di un URL univoco che era visibile esattamente una volta, solo per 2 secondi, prima che l'utente facesse clic su di esso e continuasse a visitare quella pagina. Non è stato inviato in una e-mail o pubblicato ovunque pubblico.
Cosa sta succedendo qui, come è possibile che Google abbia trovato questo URL unico?