Cosa NON puoi trovare su Google? [chiuso]


18

Google afferma di essere onesto, ed è nell'interesse dell'azienda (il più delle volte) perlustrare Internet alla ricerca di qualsiasi cosa a cui i suoi ragni possano accedere. Voglio sapere:

  • Che tipo di contenuti (accessibili al pubblico) non riesce a fornire Google?
  • Esiste un tipo specifico di contenuto che Google non può recuperare?

I riferimenti, specialmente alla documentazione di Google, sarebbero particolarmente fantastici.


Ora che l'UE ha emanato un "Diritto all'oblio", c'è un bel po 'che non saremo più in grado di trovare. Ecco alcune cose che sono state "dimenticate".
samthebrand,

Risposte:


21

Alcune idee sul tipo di cose:

  1. Il contenuto esplicitamente vietato dal robots.txtfile di un dominio è escluso dall'indice di Google.
  2. Siti Web che non sono collegati ad altri siti Web che Google già conosce. Cioè, probabilmente ci sono molti siti Web che non sono collegati da pagine visibili, tali siti Web non verranno mai trovati dallo spider di Google a meno che non vengano inviati manualmente a Google tramite gli Strumenti per i Webmaster .
  3. Siti Web che si trovano dietro i moduli Web che è necessario compilare.
  4. Immagini del censimento. Poiché i contenuti sono immagini che spesso vengono indicizzate manualmente, di solito vengono trovate su siti a pagamento come ancestry.com.

Ulteriori informazioni sul Deep Web


2
Il punto 2 non è vero. Puoi inviare un sito a Google tramite gli Strumenti per i Webmaster e verrà indicizzato anche se non è collegato da altri siti Web.
Alex,

Questo è vero. Buon chiarimento
amh

3
In realtà non sarò d'accordo con il secondo punto. Avevo un server web di prova sul mio PC ed era indicizzato. Ho trovato questo controllando il registro di accesso.
Bakudan,

2
Ho registrato nuovi domini, ho iniziato a svilupparli e ho trovato Googlebot che li ha sottoposti a scansione pochi giorni dopo. Pensavo fosse un po 'inquietante fino a quando non me ne sono reso conto - potrei non essere la prima persona a possedere questo dominio :) Non rivelano dettagli specifici, ma sono sicuro che tengono traccia dei domini che la gente pensava fossero abbastanza importanti per registrarsi e in almeno alcuni hanno visitato ad un certo punto, almeno per un certo periodo di tempo.
Tim Post

6

A parte Twitter, Google non indicizza altrettanto bene Tumblr . I post di blog su Tumblr sono più facili da trovare utilizzando la ricerca di Tumblr. Inoltre, tutto su Google Sites non è (o è quasi) indicizzato. Se avvii un sito Google, ottieni il tuo dominio.

I blog più piccoli che non vengono aggiornati regolarmente vengono spesso scaricati dai risultati di ricerca. Inoltre tutto ciò che pensano sia uno splog .


5

Bene, la maggior parte dei contenuti di Twitter non è indicizzata da Google, anche se è pubblica. Era disponibile per Google, ma non è più il caso da quando il loro accordo è scaduto.

Fonte .


Sebbene sia vero, la domanda pone quali "contenuti di alta qualità" non sono disponibili in Google. La maggior parte di Twitter non soddisfa questi criteri :) Vedo però lo strano tweet apparire nella ricerca di Google.
HappyTimeGopher

4

Dipende da quale paese sei. In Germania non mostra migliaia di siti che il governo ritiene non siano buoni per te e l'elenco aumenta di migliaia ogni anno.

Google è il motore della censura di Internet. Se vuoi un Internet gratuito, usa alcune compagnie non malvagie, come DuckDuckGo o altre.




1

Siti con così tanti contenuti che Google semplicemente non ha avuto il tempo (o l'inclinazione) di indicizzarli tutti.

I siti che non dispongono di una mappa del sito di cui è possibile eseguire la scansione e richiedono che Google fornisca i termini di ricerca per accedere ai risultati disponibili sul sito potrebbero non essere completamente indicizzati.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.