Perché Google non riesce a trovare i dati strutturati sulla maggior parte delle mie pagine indicizzate?


13

Ho un sito Web con circa 30.000 pagine. L'indice di Google è OK, quasi tutte le pagine sono indicizzate, ma nei dati strutturati vedo solo 48 pagine rilevate per schema.org. Schema.org è identico all'intero sito Web.

La mia domanda è: perché esiste una differenza così grande tra le pagine indicizzate e rilevate con le pagine di markup?

Soprattutto ho lavorato duramente per implementare tutti gli schemi adatti per il mio sito Web e ora Google non li rileva.

Pagine indicizzate - oltre 27.000 Dati strutturati in Strumenti per i Webmaster: 48 pagine

Pagine con schema.org - 48 Pagine indicizzate in Strumenti per i Webmaster: oltre 27.000


5
Strumenti per i Webmaster può essere lento nel riportare i risultati in quanto non è in tempo reale, inoltre può richiedere anche diverse ricerche per indicizzazione. La domanda importante è: quanti dei tuoi URL eseguono la scansione di Google al mese, ne dubito moltissimo 27.000, poiché mi aspetto di vedere un numero maggiore. Google indicizzerà e aggiornerà sempre le pagine più popolari poiché vengono sottoposte a scansione più spesso, alcuni URL che non sono stati aggiornati da mesi a anni potrebbero richiedere giorni, settimane o addirittura mesi per l'aggiornamento ..
Simon Hayter

5
Per aggiornare ciò che ha detto @bybe (un voto positivo sul commento). Google ha una metrica di stile TTL per ogni pagina. Se la pagina è nuova o non si aggiorna spesso, Google non la visiterà spesso. Se la pagina è aggiornata e cambia spesso, il tempo TTL per la pagina diminuirà nel tempo e Google visiterà la pagina più spesso. La freschezza è una metrica importante nel tuo scenario. Se il tuo sito ha uno standard di aggiornamento, potrebbe essere necessario un po 'di tempo prima che Google rilevi il cambiamento. Se il tuo sito è nuovo, potrebbe verificare la freschezza con alcune richieste di test di esempio.
closetnoc,

Nel mio caso si tratta di un nuovo sito Web - questo può essere visto dal grafico delle pagine indicizzate - inizia ad agosto 2014. bybe - Non chiedo pagine scansionate, ma indicizzate. E posso aspettarmi quei punti che entrambi avete notato, ma sto chiedendo la differenza tra pagine indicizzate e pagine con markup dello schema. Mentre il contenuto può essere modificato spesso o meno, lo schema fa parte della struttura HTML. E questa domanda è molto importante per me perché inizio a lavorare sodo con schema.org per ogni mio progetto come è raccomandato da Google.
DFuchidzhiev,

Come ho detto, possono essere necessarie diverse ricerche per indicizzazione e può essere necessario più tempo prima che appaia in Strumenti per i Webmaster. Ci vuole anche più tempo perché questi schemi appaiano effettivamente nei motori di ricerca, ad esempio stelle, prezzi in magazzino e altri vantaggi che compaiono nei risultati di ricerca (generalmente 2-3 mesi). Finché il tuo codice si verifica bene nel test Rich Snippet c'è poco che puoi fare ... basta dire ai clienti che ci vogliono 2-3 mesi e non dovresti mai promettere che i dati ricchi vengano effettivamente visualizzati nei risultati poiché Google non restituisce sempre i dati nei risultati effettivi.
Simon Hayter

Risposte:


5

Ecco come funziona in base ai siti che abbiamo rilasciato di recente + un paio che sono in esecuzione da un po '.

Supponendo che sia un nuovo sito che utilizza tutto Schema.org e il vocabolario di fallback per dati di briciole e recensioni, dovresti aspettarti un ritardo di almeno 3 mesi. Vedrai che i rapporti dello schema degli strumenti per i webmaster di Google non fanno nulla: nessuna nuova recensione, nessuna nuova pagina .... anche i picchi quindi diminuiscono di conteggi o falsi allarmi. Non preoccuparti, è solo GADHD. Un giorno del mese 2 (ish) potresti vedere tutti i conteggi iniziare a compilare, livellare e stabilizzarsi. È possibile che i widget SERP con vocab di dati di fallback si attivino su pagine trafficate / nuove. A un mese da questo punto, i widget SERP di schema.org dovrebbero attivarsi supponendo che non vi siano errori in GWT. Si può notare avanti e indietro, soprattutto per recensioni, prezzi, ecc. Durante questo periodo. Un giorno saranno accesi, un altro spento. Una query attivata, un'altra disattivata. Alla fine le SERP si stabilizzeranno,

Come sottolineato da closetnoc in un commento per la domanda originale, RDF si innesca da dati / pagine focali freschi. Potrebbero essere necessari molto più di 3 mesi per quelle pagine sepolte che non ottengono mai hit, forse fino a un anno per quelle veramente vecchie. È una buona idea rinfrescare le aree in cui si desidera attivare ricchi widget SERP. Google mostrerà di essere indicizzati-RDF in GWT, pronti per il rock n roll, ma i widget SERP effettivi non si attiveranno fino a quando il trigger non lo consente. Questo trigger è fresco / traffico / interesse / ricerche nelle tue pagine RDF "già indicizzate".

Basta essere pazienti e aspettarsi di vedere un sacco di fluazioni e incoerenze. Questo è il modo in cui l'indice bot RDF ruota con il motore di previsione + query pop immagino.


1
Rivisitazione di questa risposta: sembra che lo stato di accesso di Google+ combinato con G + local per biz influisca sulla velocità con cui la SERPS mostra i dati strutturati. A quanto pare, stanno monitorando l'interesse sociale + locale a livello di SERP e sembrano essere più liberali nei rich snippet che mostrano lì. Ad esempio, le stelle di recensione possono essere mostrate a un utente G + e a qualsiasi utente non G + nella tua località. Considerando che, potrebbe essere necessario un altro mese per mostrare le stesse stelle per il resto del mondo non registrato non locale. Morale del commento: assicurati di impostare G + local per i tuoi siti, quindi verifica anche come editore.
Dhaupin,

Tieni presente che i miei strumenti per i webmaster hanno iniziato a mostrare i miei dati strutturati 6 giorni dopo la loro pubblicazione sul mio sito, quindi ora questo potrebbe essere migliorato
Matt Wilko,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.