Come commentare / rispondere noindex in Drupal 7


9

Uso Drupal 7 e sto cercando di utilizzare il metatag "noindex" per impedire che http://example.com/comment/reply/43/738 venga indicizzato dai motori di ricerca.

La pagina di commento / risposta viene indicizzata, anche se ho utilizzato il seguente ruolo in robots.txt:

Disallow: /comment/reply/

In quale file modello dovrò incorporare il meta tag "noindex" per / comment / reply / pages?


1
Quale regola hai scritto nel tuo robots.txtfile?
tostinni,

@tostini: ho usato Disallow: / comment / reply /
Naweed Chougle il

Risposte:


7

Puoi usare uno di questi codici in robots.txt:

User-agent: *
Disallow: /*comment

Questo trascurerà ogni URL che contiene commenti .

È inoltre possibile utilizzare quanto segue per trascurare ogni URL contenente / commento .

User-agent: *
Disallow: /comment/reply
User-agent: *
Disallow: /comment

Dopo aver effettuato l'operazione, controlla se funziona o meno utilizzando il correttore Google Robots.txt .



Poiché Noindex è il metatag, impedisce l'indicizzazione dell'intera pagina. Adesso hai disattivato la scansione dei commenti in modo da poter rimuovere i link indicizzati da Google utilizzando gli strumenti per i webmaster. vai alla configurazione del sito >> accesso crawler >> Rimuovi URL. Penso che questa sarà la soluzione migliore.
Vivek R

Dopo aver rimosso gli URL utilizzando gli strumenti per i webmaster, ne vengono visualizzati di nuovi con lo stesso modello / commento / risposta /! E gli URL sono stati indicizzati anche se Disallow: / comment / reply / veniva utilizzato nel file robot.
Naweed Chougle,

2
dedicare un po 'di tempo alla rimozione del motore di ricerca ... non succederà dall'oggi al domani, quindi attendere un po' di tempo ... potrebbe essere una settimana circa.
Vivek R,

Come ho detto prima, gli URL venivano indicizzati anche dopo aver usato Disallow / comment / reply / .... Questo potrebbe accadere a causa di collegamenti al modulo di risposta provenienti da siti esterni. Ho aggiornato la mia domanda e incluso dettagli sulla possibile necessità del tag meta noindex.
Naweed Chougle,

4

Nel template.php del tuo tema, o in page.tpl.php, puoi controllare l'URL della pagina per vedere se la pagina è una pagina di commento, quindi aggiungere il codice che inserirà il meta tag.

Puoi farlo nella funzione template.php YOURTHEME_preprocess_html (), oppure inserirlo da qualche parte vicino alla parte superiore di page.tpl.php. Il codice da aggiungere sarebbe qualcosa del genere:

    <?php
      $element = array(
        '#tag' => 'meta', 
        '#attributes' => array(
          'property' => 'robots',
          'content' => 'noindex',
        ),
      );
    drupal_add_html_head($element, 'robots');
?>

Vedi drupal_add_html_head () .


Grazie, @jmarkel! Potete aiutarmi a verificare, a livello di codice, che la pagina sia simile a: example.com/comment/reply/32/409 .... in modo da poter impostare il meta noindex solo per tali pagine?
Naweed Chougle,

1
Ecco il problema - in realtà non esiste alcun tipo di nodo come un commento - sembrano vivere solo con i nodi su cui stanno commentando. Quindi non è davvero possibile distinguerli genericamente. Se fai clic sul permalink di un commento, otterrai un URL che inizia con 'comment /' ma non aiuta perché non portano quell'URL internamente. Suppongo che potresti cercare l'argomento "pagina" nelle pagine successive (cioè quando c'è più di una pagina di commenti) ma ti rimane ancora la necessità di distinguere tra commenti e altre pagine usando un cercapersone. Per farla breve - non so come farlo ...
jmarkel

Per ora, @jmarkel, dovrò vivere con lo strumento di rimozione URL del webmaster di Google. Passando a uno dei video di Matt Cutts, sembra che un URL rimosso non riapparirà. Il problema è che ne ho visti di nuovi apparire nei risultati di ricerca!
Naweed Chougle,

1

Aggiornamento : i seguenti lavori, stampa <meta name="robots" content="noindex,follow" />nella sezione head di tutte le pagine a cui si accede tramite un percorso che inizia con comment. Questo per aggirare il fatto che una pagina come comment / 3 internamente porta node / nid come argomenti, come sottolineato da jmarkel sopra.

<?php
function metarobots_comment_help() {
  $url_components = explode('/', request_uri());
  if ($url_components[1] == 'comment') {
    $elements = array(
      '#tag' => 'meta',
      '#attributes' => array(
        'name' => 'robots',
        'content' => 'noindex,follow',
      ),
    );
   drupal_add_html_head($elements, 'robots');
  }
}

Con l'aiuto di un utile commento sulla funzione arg .

Spero che questo alla fine venga risolto dal modulo Meta Tag: c'è una richiesta di funzionalità , ma non è ancora chiaro se l'autore del modulo vuole supportarlo.


[Il mio commento precedente] Volevo solo aggiungere che usare robots.txt non è la risposta - come hai già notato, i collegamenti continuano a comparire nei risultati di ricerca nonostante l'utilizzo Disallow: /comment. Ciò è previsto, poiché robots.txt dice al bot di non eseguire la scansione di quelle pagine, ma non dice a Google di non indicizzarlo. Come spiegato su SEOmoz Robots.txt e Meta Robots Best practice per l'ottimizzazione dei motori di ricerca :

Nella maggior parte dei casi, i meta robot con parametri "noindex, follow" dovrebbero essere impiegati come un modo per limitare la scansione o l'indicizzazione.

Blocca con Robots.txt: indica ai motori di non eseguire la ricerca per indicizzazione dell'URL specificato, ma informa che potrebbero mantenere la pagina nell'indice e visualizzarla nei risultati.

Blocca con Meta NoIndex: indica ai motori che possono visitare ma non possono visualizzare l'URL nei risultati. (Questo è il metodo consigliato) Quindi il meta tag noindex che stai cercando è davvero quello che ti serve.


È vero, @arjan, hai riaffermato uno dei commenti che ho fatto con ulteriori dettagli. Sto cercando un modo per impostare meta noindex per le pagine che non voglio nei risultati di ricerca.
Naweed Chougle

1
Sì, sembrava che tu non fossi sicuro al 100%, quindi volevo aggiungere che è corretto;)
Arjan

@ProgrammingEnthusiast: vedi aggiornamento sopra.
Arjan,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.