Googlebot è il software bot che Google utilizza per eseguire la scansione di oltre 20 miliardi di pagine ogni giorno, i dati ottenuti durante una scansione vengono quindi analizzati e classificati nella Ricerca Google.
Sto monitorando la geolocalizzazione di ogni membro (usando db-ip) e tutto va bene tranne i telefoni cellulari con il browser Chrome. Mi danno sempre il risultato US Mountain View California ip:66.249.xxx.xxx. Questo è Google; Ne sono sicuro al 100%. Ma la persona che visita il sito Web è me stesso. …
Come posso impedire che i miei file Sitemap XML vengano visualizzati nei risultati di ricerca di Google come questo risultato di una site:query di ricerca: Per prima cosa, non capisco perché Google abbia scelto di mostrare i file delle Sitemap nei risultati di ricerca. Questi file non sono pensati per …
Molto è stato fatto della frequenza di scansione del ragno Baidu. È vero: "Baiduspider striscia come un matto." Ho sperimentato questo fenomeno in siti con cui lavoro. In almeno un caso, ho scoperto che Baiduspider esegue la scansione alla stessa frequenza di Googlebot, nonostante Baidu fornisca circa l'1% del traffico …
Ho aggiunto un file robots.txt a uno dei miei siti una settimana fa, il che avrebbe dovuto impedire a Googlebot di tentare di recuperare determinati URL. Tuttavia, questo fine settimana vedo Googlebot caricare quegli URL esatti. Google memorizza nella cache robots.txt e, in tal caso, dovrebbe?
Ogni volta che creo un sito Web reattivo di solito creo 2 menu: 1 nascosto e utilizzato per dispositivi mobili e l'altro visualizzato come menu principale, quindi nascosto per mostrare il menu mobile. Ogni volta che si tratta di SEO e spider che navigano nel sito web mi viene offeso …
Attualmente reindirizzo tutte le connessioni non HTTPS a HTTPS e supporto TLS v1, TLS v1.1 e TLS v1.2. Ho riconfigurato il mio server di test per accettare solo una suite di crittografia molto limitata e sicura e solo TLSv1.2. Durante l'esecuzione del test SSL Labs ho notato che la loro …
Ho visto codice come per impedire a Google di indicizzare parte di una pagina: <p>This is a paragraph that will be indexed by Google.</p> <!--googleoff: index--> <p>This is a paragraph that will NOT be indexed by Google.</p> <!--googleon: index> funziona?
Ecco uno dei miei clienti, che esegue alcune azioni dopo aver effettuato l'accesso al suo account. Il token univoco è semplicemente un ID utente crittografato + data / ora. 94.254.xxx.xxx - - [02 / Jul / 2011: 22: 25: 46 +0200] "GET / some-action / unique-token-123abc HTTP / 1.1" 200 …
Ho notato che Google Webmaster Tools sta segnalando molte risorse bloccate nel mio sito Web. In questo momento tutte le "risorse bloccate" sono .css, .js e immagini (.jpg, .png) che offro da Cloudfront CDN. Ho passato molto tempo a testare e cercare di capire perché Google non esegue la scansione …
Avendo scritto un numero di bot e visto l'enorme quantità di bot casuali che accadono durante la scansione di un sito, mi chiedo come webmaster, quali robot vale davvero la pena far entrare in un sito? Il mio primo pensiero è che consentire i bot sul sito può potenzialmente portare …
Contesto: abbiamo un sito Web disponibile in versioni in più lingue. Tuttavia, il contenuto è lo stesso. Ogni versione tradotta del sito è disponibile su un sottodominio distinto. In alcune pagine, usiamo <link rel="canonical" />per indicare la versione canonica nella stessa lingua della stessa pagina, se necessario. Questo è solo …
Ho incontrato questo articolo nelle mie notizie SEO oggi. Sembra implicare che è possibile utilizzare le Noindex:direttive oltre alle Disallow:direttive standard in robots.txt . Disallow: /page-one.html Noindex: /page-two.html Sembra che impedirebbe ai motori di ricerca di eseguire la scansione della pagina uno e impedire loro di indicizzare la pagina due. …
Se ho contenuto dietro un modulo POST (una casella selezionata, nel mio caso) Googlebot o altri spider dei motori di ricerca saranno in grado di eseguire la scansione del contenuto dietro quel modulo? Ad esempio, se dovessi avere 4 traduzioni di una pagina e la selezione della lingua fosse un …
Avevo un paio di file privati in una directory nella mia cartella di scuola. Si potrebbe vedere che i file esistevano andando su myschool.edu/myusername/myfolder, ma tentando di accedere ai file stessi tramite myschool.edu/myusername/myfolder/myfile.html restituisce un errore 403. Eppure Google in qualche modo è riuscito a catturare i contenuti di quei …
Quindi ora Google ha deprecato lo schema di scansione di AJAX . Dicono di non preoccuparsi di implementarlo in nuovi siti Web, perché non è più necessario poiché Googlebot ora non ha problemi a guardare i contenuti dinamici. Dovremmo immediatamente fidarci di questa affermazione, o meglio aderire allo standard deprecato …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.