Cosa può causare "Scoperto - attualmente non indicizzato" nel nuovo GWT


18

Il nuovo GWT mostra i collegamenti alle Sitemap divisi in nuove categorie. Due che mi confondono: 1. Scoperto: attualmente non indicizzato 2. Scansionato: attualmente non indicizzato

Quali sono le possibili ragioni di ciò e ci sono implicazioni a livello di sito? È un segno di Google che dovrei considerare di rimuoverli?

inserisci qui la descrizione dell'immagine

Risposte:


11

È solo una parte del processo. Non c'è niente da fare fino a quando non si ottengono effettivamente errori .

Per capire le categorie, devi capire come funziona l'indicizzazione che è qualcosa che viene fatto praticamente continuamente:

  • Googlebot recupera una pagina che significa scaricare i suoi contenuti sui server di Google. Quando ciò accade, la pagina viene sottoposta a scansione .
  • Successivamente inserisce il contenuto della pagina scaricata nell'indice. Ciò significa che la pagina è indicizzata .
  • Durante la scansione della pagina, trova like e li inserisce in una coda. Questi collegamenti vengono scoperti .

Così:

  • Scoperto non indicizzato significa che il collegamento è stato aggiunto alla coda di cose che Googlebot potrebbe eventualmente eseguire la scansione. Dal momento che il web è praticamente infinito e esiste una priorità, potrebbe non arrivarci.
  • La scansione non attualmente indicizzata significa che la pagina è stata scaricata sui server di Google ma i suoi contenuti non sono stati inseriti nell'indice.

1
Aggiungo che Google decide cosa sottoporre a scansione in base a PageRank. Il collegamento alla pagina più spesso o in modo più evidente (anche internamente) può indurre Googlebot a eseguirne la scansione.
Stephen Ostermiller

3
Penso che "non attualmente indicizzato" potrebbe anche significare che Google sta scegliendo di non indicizzarlo. Potrebbe essere duplicato o apparire di bassa qualità. Potrebbe non avere abbastanza Pagerank. Google potrebbe pensare che non corrisponderà a sufficienti ricerche.
Stephen Ostermiller

Questo è ciò a cui stavo accennando con la definizione delle priorità . Ciò accade con collegamenti sospettati di duplicati (a volte perché differiscono solo per un parametro o corrispondono a un altro canonico).
Itai,

Le pagine scorrono dentro e fuori da "Scansione non attualmente indicizzata" senza alcuna attenzione da parte mia. Le informazioni sono anche dubbie. Esempio: un URL ispezionato genera un messaggio indicante che è indicizzato, ma non in alcuna Sitemap ... la pagina è nella Sitemap ed è stata per anni. Il recente aggiornamento di algo ha inviato questo rapporto di qua e di là.
GLCoder

3

Google potrebbe scoprire e sottoporre a scansione le tue pagine, ma ciò non significa che le indicizzerà necessariamente.

Ci sono molti motivi per cui Google potrebbe non indicizzare una pagina. Forse ha trovato contenuti duplicati. Forse non ritiene che offra un valore sufficiente per qualsiasi query di ricerca specifica. Google potrebbe aver trovato qualcosa sulla tua pagina che non gli piace.

Qualunque sia la ragione, Google non ha semplicemente deciso di indicizzare alcune delle pagine che ha scoperto e sottoposto a scansione sul tuo sito. È abbastanza normale che alcune delle tue pagine non vengano indicizzate. Alcune pagine dei miei siti non sono indicizzate nonostante abbiano un contenuto migliore rispetto a molte pagine indicizzate e abbiano una notevole quantità di collegamenti interni. Il sistema di indicizzazione di Google è un algoritmo di apprendimento automatico. E quindi potrebbe decidere di non indicizzare alcune pagine a volte per una serie di motivi sconosciuti.


1
"Forse ha trovato contenuti duplicati"> Vorrei aggiungere che In questo caso, poiché il messaggio è "Scoperto - attualmente non indicizzato", indica che la pagina non è stata nemmeno recuperata (o sarebbe "Scansionata - attualmente non indicizzato "). Quindi a questo punto non sanno nulla del suo contenuto. Quindi immagino che la definizione delle priorità in questa fase dipenda dall'URL stesso, dal numero di pagine collegate ad esso e dalla possibilità di altre cose.
Niavlys,

2

Googlebot ha una propria coda, basata su parametri diversi. Questo è il messaggio su quegli URL che sono persino in coda.

inserisci qui la descrizione dell'immagine

Aj Cohn ha una sorta di opinione divertente sul significato di questo messaggio:

Scoperto: al momento non indicizzato sembra indicare che lo vedono nella tua Sitemap, ma in base all'aspetto di altri contenuti non si preoccuperanno nemmeno di scansionarlo. In sostanza, "Ya brutto!" O forse è solo una rappresentazione della scarsa efficienza di scansione.

Francamente, non sono del tutto sicuro che la definizione di Scoperto sia accurata poiché molti degli URL di esempio in questo stato hanno una data di Ultima ricerca per indicizzazione. Ciò sembra contraddire la definizione fornita.


2
Ho rimosso il bit "leggi il manuale". Questo non è utile. Soprattutto perché la documentazione di Google è piuttosto scadente.
Stephen Ostermiller

0

Anche se Google ha scoperto l'URL, non riteneva che fosse abbastanza importante passare il tempo a gattonare. Se si desidera che questa pagina riceva traffico di ricerca organico, prendere in considerazione il collegamento ad esso più all'interno del proprio sito Web. Assicurati di promuovere questo contenuto ad altri con la speranza di poter guadagnare backlink da siti Web esterni. Collegamenti esterni ai tuoi contenuti indicano a Google che una pagina è preziosa e considerata affidabile, il che aumenta le probabilità che venga indicizzata.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.