Ho incontrato questo articolo nelle mie notizie SEO oggi. Sembra implicare che è possibile utilizzare le Noindex:direttive oltre alle Disallow:direttive standard in robots.txt .
Disallow: /page-one.html
Noindex: /page-two.html
Sembra che impedirebbe ai motori di ricerca di eseguire la scansione della pagina uno e impedire loro di indicizzare la pagina due.
Questa direttiva robots.txt è supportata da Google e da altri motori di ricerca? Funziona? È documentato?
disallowimpedisce a Google di scoprire collegamenti nelle pagine padre e figlio, se presenti. Mentre noindexinterrompe semplicemente la pagina elencata, non interrompe il rilevamento mentre non lo consente.
nofollowfunziona così per i meta tag. Sarebbe bello sapere se questo è anche il caso di robots.txt .
<a rel="no-follow">anche per . Non vedo alcun motivo per cui sarebbe trattato in modo diverso. Ovviamente questo non è ufficiale ed è anche consigliato da John Muller di non usarlo nel robots.txt ma a parte il suo tweet non sono riuscito a trovare molte informazioni al riguardo.
Noindexdirettiva all'interno dei robots.txtfile come errore.