Nascondere un sottodominio da Google / Search Engine SEO Result?


11

Ho un sottodominio che non desidero elencare nei risultati di nessun motore di ricerca. Diciamo che ho:

  • http://www.example.com
  • http://child.example.com

Come posso nascondere tutti gli URL del child.example.comdominio che sono attualmente visualizzati nei risultati del motore di ricerca?

Risposte:


14

Nella radice della directory del sito Web del sottodominio, aggiungi un file chiamato robots.txt contenente:

User-agent: *
Disallow: /

Questo dirà ai web crawler di non indicizzare affatto il sito. Non devono obbedire, ma i principali lo faranno.


Ciao, credo che questa sia la cosa migliore. E un'altra cosa fammi sapere, se lo faccio, quanto tempo ci vorrà per avere effetto sui risultati Web? (es. Ricerca Google) Ho bisogno di tempo o ci vorrà all'improvviso?
夏 期 劇場

2
Verrà riconosciuto la prossima volta che gli indicizzatori eseguono la scansione del sito. Questo può variare da minuti a settimane, a seconda dell'importanza del tuo sito. Puoi spostare le cose più rapidamente aggiungendo il sito ai webmaster di Google e Bing e facendolo rileggere robots.txt: puoi anche rimuovere le pagine dall'indice lì.
Paul

1
Se si desidera accelerare il processo, è possibile inviare una richiesta di rimozione su google.com/webmasters/tools/removals per Google e inviare l'URL su bing.com/toolbox/submit-site-url per Bing (sì, è consigliato metodo per rimuovere le pagine).
Kat

Dovresti anche aggiungere noindexall'indice e alle altre pagine del sottodominio
Anagio,

Come faccio quando esiste una cartella principale comune e i nomi dei sottodomini sono dinamici? stackoverflow.com/questions/21229235/…
Gopi

6

L'uso di un file robots.txt nel tuo sottodominio aiuterà (e Google obbedirà a questo), ma un altro passo che puoi fare è specificare con un account Google Webmasters che non vuoi che questo sottodominio venga indicizzato. Puoi anche utilizzare un meta tag in tutte le pagine del sottodominio:

    <meta name="robots" content="noindex">

Se si tratta di un sito che si sta utilizzando solo per test interni, limitare la visibilità a una serie specifica di indirizzi IP nel file degli host virtuali nasconderebbe ulteriormente il sito.


In tutte le pagine ????? oh no ..
劇場 期 劇場

@ 4lvin Viene eseguito in modo dinamico dal lato server. Devi solo codificarlo una volta. Per favore, non dirmi che stai codificando singole pagine HTML.
Kenzo,

LoL, in realtà "sì". Perché questo è un sistema di servizi web molto vecchio / legacy. (ecco perché deve essere abbattuto) Molte pagine isolate all'interno. : D
夏 期 劇場

@ 4lvin Ahi ... buona fortuna!
Kenzo,

1
Invece di incorporare un metatag noindex in ogni pagina, puoi invece restituire X-Robots-Tagun'intestazione di risposta HTTP dal tuo server per il sottodominio specificato - questo devi farlo solo una volta.
Mr White

2

Le soluzioni di Kenzo e Paul sono buone, puoi inserire meta-tag noindex nelle tue pagine web e aggiungere robots.txt per impedire ai robot.

Ma a mio avviso, la soluzione migliore è utilizzare l'autenticazione della password sul tuo sottodominio. Questa è l'unica soluzione di cui sei sicuro che i robot possano accedere e indicizzare il tuo sito web. Se usi Apache, puoi implementare htpasswd .


2

... attualmente visualizzato nei risultati SEO?

Le altre risposte riguardano più la prevenzione proattiva dell'indicizzazione di un (sotto) dominio (che è principalmente quello che stai ponendo nella domanda) piuttosto che la rimozione attiva delle tue pagine dai risultati della ricerca, che potrebbe essere più ciò che stai cercando, a giudicare da l' altra tua domanda .

Devi ancora bloccare il tuo sito in robots.txt e pubblicare un tag noindex meta (o X-Robots-Tagintestazione di risposta HTTP), come indicato nelle altre risposte, ma devi anche bloccare l'accesso alle tue pagine, restituendo un codice di stato 404 o 410.

Puoi leggere ulteriori informazioni al riguardo nella pagina della guida di Strumenti per i Webmaster di Google:
Requisiti per la rimozione di contenuti

Dopo aver installato tutti questi elementi, puoi utilizzare lo strumento Rimuovi URL in Strumenti per i Webmaster di Google. Tuttavia, questo vale solo per singoli URL, non per un intero sito, ma è un inizio. (Google afferma che l'utilizzo di robots.txt, noindex e la pubblicazione di un 404 sono i requisiti per utilizzare lo strumento di rimozione GWT.)

Tuttavia, se desideri comunque che gli utenti normali possano accedere al sito digitando l'URL, allora è un problema, poiché i tuoi contenuti non sono più disponibili. Potresti password, come suggerisce Zistoloen, tuttavia questo restituirà un 403 (proibito) per impostazione predefinita che dovrai sostituire per restituire un 404/410. Potresti nascondere i tuoi contenuti, restituendo un 410 a Googlebot e consentire a tutti gli altri di entrare - ma che dire delle persone che fanno clic sui risultati nelle SERP?

Ma se vuoi che Google rimuova i tuoi contenuti nel minor tempo possibile, devi rimuoverli da Internet "Google".

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.