Se il tuo obiettivo è che queste pagine non siano visibili al pubblico, è meglio inserire una password in questo set di pagine. E / o avere una configurazione che consente solo indirizzi specifici e autorizzati in grado di accedere al sito (ciò può essere fatto a livello di server, probabilmente tramite l'host o l'amministratore del server).
Se il tuo obiettivo è far sì che queste pagine esistano, semplicemente non indicizzate da Google o da altri motori di ricerca, come altri hanno già detto, hai alcune opzioni, ma penso che sia importante distinguere tra le due funzioni principali di Ricerca Google in questo sense: scansione e indicizzazione.
Scansione o indicizzazione
Google esegue la scansione del tuo sito, Google indicizza il tuo sito. I crawler trovano le pagine del tuo sito, l'indicizzazione sta organizzando le pagine del tuo sito. Maggiori informazioni su questo un po ' qui .
Questa distinzione è importante quando si tenta di bloccare o rimuovere pagine dall '"Indice" di Google. Molte persone si limitano a bloccare semplicemente tramite robots.txt, che è una direttiva che dice a Google cosa (o cosa no) sottoporre a scansione. Si presume spesso che se Google non esegue la scansione del tuo sito, è improbabile che lo indicizzi. Tuttavia, è estremamente comune vedere pagine bloccate da robots.txt, indicizzate in Google.
Direttive su Google e sui motori di ricerca
Questo tipo di "direttive" sono semplicemente raccomandazioni a Google su quale parte del tuo sito scansionare e indicizzare. Non sono tenuti a seguirli. Questo è importante sapere. Ho visto molti sviluppatori nel corso degli anni pensare che possono semplicemente bloccare il sito tramite robots.txt e improvvisamente il sito viene indicizzato su Google poche settimane dopo. Se qualcun altro si collega al sito o se uno dei crawler di Google in qualche modo riesce a bloccarlo, può comunque essere indicizzato .
Di recente, con la dashboard aggiornata di GSC (Google Search Console), hanno questo rapporto chiamato "Rapporto sulla copertura dell'indice". Qui sono disponibili nuovi dati per i webmaster che non sono stati direttamente disponibili prima, dettagli specifici su come Google gestisce un determinato set di pagine. Ho visto e sentito parlare di molti siti Web che ricevono "Avvisi", etichettati "Indicizzati, ma bloccati da Robots.txt".
L' ultima documentazione di Google menziona che se si desidera che le pagine escano dall'indice, aggiungere tag noindex nofollow ad esso.
Rimuovi strumento URL
Solo per basarci su ciò che alcuni altri hanno menzionato sullo "Rimuovi strumento URL" ....
Se le pagine sono già indicizzate ed è urgente farle uscire, lo "Strumento Rimuovi URL" di Google ti permetterà di bloccare "temporaneamente" le pagine dai risultati di ricerca. La richiesta dura 90 giorni, ma l'ho usata per rimuovere le pagine più rapidamente da Google rispetto all'utilizzo di noindex, nofollow, un po 'come un livello aggiuntivo.
Utilizzando lo strumento "Rimuovi URL", Google eseguirà comunque la scansione della pagina e, eventualmente, la memorizzerà nella cache, ma mentre stai usando questa funzione, puoi aggiungere i tag nofollow noindex, così li vede, e al momento i 90 giorni sono si spera che saprà non indicizzare più la tua pagina.
IMPORTANTE: l'utilizzo di entrambi i tag robots.txt e noindex nofollow è un segnale in conflitto con Google.
Il motivo è che se dici a Google di non eseguire la scansione di una pagina e quindi non hai nindollow su quella pagina, potrebbe non eseguire la scansione per vedere il tag noindex nofollow. Può quindi essere indicizzato tramite qualche altro metodo (che sia un collegamento o quant'altro). I dettagli sul perché ciò accada sono piuttosto vaghi, ma l'ho visto accadere.
In breve, a mio avviso, il modo migliore per impedire l'indicizzazione di URL specifici è quello di aggiungere un tag nofollow noindex a quelle pagine. Con ciò, assicurati di non bloccare quegli URL anche con robots.txt, in quanto ciò potrebbe impedire a Google di vedere correttamente quei tag. Puoi sfruttare lo strumento Rimuovi URL da Google per nasconderli temporaneamente dai risultati di ricerca mentre Google elabora il tuo noindex nofollow.