Ho incontrato questo articolo nelle mie notizie SEO oggi. Sembra implicare che è possibile utilizzare le Noindex:
direttive oltre alle Disallow:
direttive standard in robots.txt .
Disallow: /page-one.html
Noindex: /page-two.html
Sembra che impedirebbe ai motori di ricerca di eseguire la scansione della pagina uno e impedire loro di indicizzare la pagina due.
Questa direttiva robots.txt è supportata da Google e da altri motori di ricerca? Funziona? È documentato?
disallow
impedisce a Google di scoprire collegamenti nelle pagine padre e figlio, se presenti. Mentre noindex
interrompe semplicemente la pagina elencata, non interrompe il rilevamento mentre non lo consente.
nofollow
funziona così per i meta tag. Sarebbe bello sapere se questo è anche il caso di robots.txt .
<a rel="no-follow">
anche per . Non vedo alcun motivo per cui sarebbe trattato in modo diverso. Ovviamente questo non è ufficiale ed è anche consigliato da John Muller di non usarlo nel robots.txt ma a parte il suo tweet non sono riuscito a trovare molte informazioni al riguardo.
Noindex
direttiva all'interno dei robots.txt
file come errore.