Perché i motori di ricerca non stanno indicizzando i miei contenuti?


29

Questo è un generale, della comunità wiki catch-all domanda e risposta coppia intende affrontare le domande riguardanti i motivi di un sito o sito specifico testo non compare nei risultati dei motori di ricerca.

Se la tua domanda è stata chiusa come duplicato di questa domanda e ritieni che le informazioni fornite qui non forniscano una risposta sufficiente, ti preghiamo di aprire una discussione su Pro Webmasters Meta .

Il mio sito (o pagine specifiche sul mio sito) non viene visualizzato nei risultati del motore di ricerca.

Perché i miei contenuti non sono indicizzati e cosa posso fare al riguardo?

Risposte:


36

Esistono diversi motivi per cui i tuoi contenuti potrebbero non apparire nei risultati dei motori di ricerca, tuttavia è importante notare che l' indice di un motore di ricerca può contenere pagine che non vengono visualizzate nella pagina dei risultati .

Come sapere se il tuo contenuto è effettivamente indicizzato

In realtà potrebbe essere difficile dire se i tuoi contenuti sono indicizzati.

  • Cerca tutti i documenti dal tuo sito e vedi quanti sono elencati
    • Google: inserisci site:example.com(dov'è il example.comtuo dominio, non ci deve essere spazio dopo i due punti.)
    • Bing: inviosite: example.com
    • Yahoo: inserisci site: example.com(o usa il modulo di ricerca avanzata)
  • Cerca un documento specifico con una frase unica di otto-dodici parole e cerca quella frase tra virgolette. Ad esempio, per trovare questo documento, potresti scegliere di cercare "numero di motivi per cui i tuoi contenuti potrebbero non apparire nei risultati dei motori di ricerca"
  • Oltre a quanto sopra, cerca le parole chiave usando inurl:e intitle:potresti provare qualcosa del genere, keyword with another keyword inurl:example.comquesto porterà le pagine upi che sono indicizzate solo per il dominio specificato.

    • Accedi agli strumenti per i webmaster per visualizzare le statistiche del motore di ricerca stesso su quante pagine sono indicizzate dal sito
    • Strumenti per i Webmaster di Google - Le informazioni sono disponibili in "Integrità" »" Stato indice ". Se hai inviato mappe del sito, puoi anche vedere quanti documenti in ciascun file della mappa del sito sono stati indicizzati.
    • Strumenti per i Webmaster di Bing

In alcuni casi, i documenti potrebbero non essere indicizzati tramite uno di questi metodi, ma i documenti possono essere trovati nell'indice utilizzando altri metodi. Ad esempio, gli strumenti per i webmaster potrebbero segnalare che pochi documenti sono indicizzati anche quando è possibile cercare le loro frasi e trovare i documenti sul motore di ricerca. In tal caso, i documenti vengono effettivamente indicizzati.

Come viene indicizzato il contenuto

Prima che i motori di ricerca indicizzino il contenuto, devono trovarlo utilizzando un web crawler. Dovresti controllare i log del tuo server web per vedere se i crawler dei motori di ricerca (identificati dal loro agente utente - ad esempio Googlebot , Bing / MSNbot ) stanno visitando il tuo sito.

I motori di ricerca più grandi come Google e Bing di solito eseguono la scansione frequente dei siti, ma il crawler potrebbe non conoscere il nuovo sito. Puoi avvisare i motori di ricerca dell'esistenza del tuo sito registrandoti come suo webmaster ( Strumenti per i Webmaster di Google , Strumenti per i Webmaster di Bing ) o, se il motore di ricerca non fornisce questa funzione, inviando un link ai suoi crawler (ad es. Yahoo ).

Da quanto tempo il tuo sito / contenuto è online?

I motori di ricerca possono indicizzare il contenuto molto rapidamente dopo che è stato trovato, tuttavia, questi aggiornamenti sono occasionalmente ritardati. I motori di ricerca più piccoli possono anche essere molto meno reattivi e richiedere settimane per indicizzare nuovi contenuti.

Se i tuoi contenuti sono online da diversi giorni e non hanno collegamenti da altri siti (o i loro collegamenti provengono da siti che i crawler non visitano frequentemente), probabilmente non vengono indicizzati. Se il tuo sito non è attivo da più di qualche mese, i motori di ricerca potrebbero non fidarsi abbastanza di indicizzarne ancora molti contenuti.

Il contenuto è stato escluso dal webmaster?

Questo passaggio è particolarmente importante se stai rilevando un sito da qualcun altro e c'è un problema con una pagina o una directory specifica: controlla le esclusioni di robot robots.txt e META e rimuovile se vuoi che i crawler indicizzino il contenuto escluso.

Esiste un problema tecnico che impedisce l'indicizzazione dei tuoi contenuti?

Se disponi di un sito stabilito ma il contenuto specifico non viene indicizzato (non esistono hit del crawler Web sugli URL in cui risiede il contenuto), gli strumenti per i webmaster forniti da Google e Bing possono fornire utili informazioni diagnostiche.

La documentazione relativa agli errori di scansione di Google fornisce informazioni dettagliate sui problemi comuni dei crawler Web che impediscono l'indicizzazione dei contenuti e, se si utilizzano gli Strumenti per i Webmaster di Google, si riceverà un avviso se viene rilevato uno di questi problemi sul proprio sito.

Correggi gli errori e le configurazioni errate il più rapidamente possibile per garantire che tutto il contenuto del tuo sito sia indicizzato.

Il contenuto è di bassa qualità?

I motori di ricerca non indicizzano la maggior parte delle pagine sottoposte a scansione. Indicizzano solo i contenuti della più alta qualità. I motori di ricerca non indicizzeranno il contenuto se:

  • È spam, senza senso o senza senso.
  • Si trova altrove. Quando i motori di ricerca trovano contenuti duplicati, scelgono solo uno dei duplicati da indicizzare. Di solito questo è l'originale che ha più reputazione e collegamenti.
  • È sottile. Ha bisogno di più di un paio di righe di testo originale. Preferibilmente molto di più. È improbabile che le pagine create automaticamente con pochi contenuti come una pagina per ciascuno dei tuoi utenti vengano indicizzate.
  • Non ha abbastanza reputazione o collegamenti. Una pagina potrebbe essere sepolta troppo in profondità nel tuo sito per essere classificata. È improbabile che qualsiasi pagina senza link esterni e più di pochi clic dalla home page venga indicizzata.

Alcuni dei tuoi contenuti sono indicizzati, ma non tutti?

Se il tuo sito ha centinaia di pagine, Google non sceglierà quasi mai di indicizzare ogni singola pagina. Se il tuo sito ha decine di migliaia di pagine, è molto comune per Google scegliere di indicizzare solo una piccola parte di quelle pagine.

Google sceglie il numero di pagine da indicizzare da un sito in base alla reputazione generale del sito e alla qualità dei contenuti. Google in genere indicizza una percentuale maggiore di un sito nel tempo man mano che la reputazione del sito aumenta.



1

Penso di non aver bisogno di ripetere la stessa cosa di cui sopra, tuttavia se non si ha familiarità con il nuovo strumento, ecco il modo per verificarlo di seguito.

Puoi verificare se il tuo file robot.txt non blocca il contenuto accedendo allo strumento tester robots.txt di Google Webmaster precedente

inserisci qui la descrizione dell'immagine

Google Search Console (nuova versione)

La console di ricerca di Google fornisce informazioni preziose rispetto alla versione precedente. Verifica i problemi direttamente da Google Search Console, indipendentemente dal fatto che la tua pagina sia sottoposta a scansione o meno, indicizzata o meno, in diretta o meno e se presenti.

  1. Accedi alla Google Search Console del tuo sito web
  2. Se hai più proprietà del dominio, assicurati di aver selezionato quello desiderato.

Strumento obsoleto in Google Webmaster

Questo è obsoleto ora

Ecco come puoi passare attraverso la nuova Search Console

Nuova console di ricerca di Google


0

Se nella directory principale è presente un file robots.txt, è possibile che Google indichi di non indicizzare il tuo sito.

Hai controllato per quello?

Di solito è sicuro eliminare (o rinominare) quei file poiché sembra che tu voglia essere indicizzato.

IMPORTANTE: può essere un problema se stai cercando di far funzionare Google Adsense sul tuo sito.

Indipendentemente da dove inserisci il tuo codice speciale, se non sei indicizzato ti verrà comunicato che il tuo sito è inattivo, quindi non possono verificarlo.


Il file robots.txt ha una serie di regole definite dall'utente da sottoporre a scansione o meno, quindi rimuoverlo non è una soluzione in quanto si tratta del primo file da sottoporre a scansione. La migliore soluzione è fissare le regole, testare il file robots.txt aggiungere la direttiva sitemap nel tuo robot.txt mantenere la tua sitemap aggiornata con lastmod e modificare gli attributi di frequenza.
Deepak Mathur,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.