Aggiornamento : i seguenti lavori, stampa <meta name="robots" content="noindex,follow" />
nella sezione head di tutte le pagine a cui si accede tramite un percorso che inizia con comment
. Questo per aggirare il fatto che una pagina come comment / 3 internamente porta node / nid come argomenti, come sottolineato da jmarkel sopra.
<?php
function metarobots_comment_help() {
$url_components = explode('/', request_uri());
if ($url_components[1] == 'comment') {
$elements = array(
'#tag' => 'meta',
'#attributes' => array(
'name' => 'robots',
'content' => 'noindex,follow',
),
);
drupal_add_html_head($elements, 'robots');
}
}
Con l'aiuto di un utile commento sulla funzione arg .
Spero che questo alla fine venga risolto dal modulo Meta Tag: c'è una richiesta di funzionalità , ma non è ancora chiaro se l'autore del modulo vuole supportarlo.
[Il mio commento precedente] Volevo solo aggiungere che usare robots.txt non è la risposta - come hai già notato, i collegamenti continuano a comparire nei risultati di ricerca nonostante l'utilizzo Disallow: /comment
. Ciò è previsto, poiché robots.txt dice al bot di non eseguire la scansione di quelle pagine, ma non dice a Google di non indicizzarlo. Come spiegato su SEOmoz Robots.txt e Meta Robots Best practice per l'ottimizzazione dei motori di ricerca :
Nella maggior parte dei casi, i meta robot con parametri "noindex, follow" dovrebbero essere impiegati come un modo per limitare la scansione o l'indicizzazione.
Blocca con Robots.txt: indica ai motori di non eseguire la ricerca per indicizzazione dell'URL specificato, ma informa che potrebbero mantenere la pagina nell'indice e visualizzarla nei risultati.
Blocca con Meta NoIndex: indica ai motori che possono visitare ma non possono visualizzare l'URL nei risultati. (Questo è il metodo consigliato) Quindi il meta tag noindex che stai cercando è davvero quello che ti serve.
robots.txt
file?