Come gestire contenuti / URL duplicati in Joomla?


11

Ho appena scoperto un grosso problema SEO e, per il momento, l'ho risolto; Sto cercando di capire perché potrebbe essersi verificato in primo luogo e se si è verificato un errore o ha a che fare con Joomla stesso. Innanzitutto il problema:

Quando ho eseguito la scansione di un sito con Moz, ha mostrato quattro contenuti duplicati per la homepage che era inaspettato. Ad esempio, per la homepage http://www.foo.com mostrava URL di contenuti duplicati come il seguente:

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

E tutti questi link stavano semplicemente caricando il contenuto della homepage ma i meta dettagli erano dall'articolo. Questo ovviamente ha indicato che Joomla stava creando automaticamente i collegamenti e ho trovato lo stesso per i 4 collegamenti. Il link nell'articolo era così:

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

I Itemid = 1corrisponde alla voce di menu home page che spiega il motivo per cui la home page stava caricando. Ho provato a ricreare il problema ma non ci sono riuscito. Secondo le persone che hanno aggiunto il contenuto, ecco i passaggi che hanno fatto durante la creazione di tali articoli e collegamenti al suo interno:

  1. Crea articoli
  2. Aggiungi link ad altri articoli usando la scheda "Articolo" nell'editor dei contenuti.
  3. Crea una voce di menu negli articoli

Quindi mi chiedevo se ci fosse qualcosa di ovviamente sbagliato qui. Sono confuso perché ci sono oltre 100 articoli, ma questo è successo solo in circa 5 articoli. Grazie.

Risposte:


15

TOC di questa risposta:

  1. Contenuto con lo stesso ID oggetto
  2. Come vengono creati i contenuti duplicati / Pagine / URL dinamici
  3. Prospettiva SEO
  4. Trattare con contenuti duplicati in Joomla
  5. Riferimenti e collegamenti

1. Perché gli articoli vengono visualizzati sotto lo stesso itemid

Prima di tutto, questo non è il problema per cui stai ricevendo URL duplicati. Gli articoli utilizzano l'ID articolo della home page, perché non è stato assegnato alcun altro ID articolo.

Leggi di più riguardo a questo:

E questo potrebbe anche essere perspicace:



2. Come viene creato il "contenuto duplicato" / Pagine / URL dinamici

Questo è in realtà un comportamento standard per i siti Web dinamici che generano le loro pagine utilizzando i parametri URL per costruire stringhe di query sotto forma di coppie campo-valore . Il server / l'applicazione riceverà la query, la elaborerà e restituirà il contenuto associativo al browser.

Per capirlo meglio, potresti voler disabilitare gli URL SEF in un sito Web Joomla e studiare un po 'l'Url non SEF di una pagina:

Esempio:

index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101

Dividendo la query sopra in coppie campi-valore vediamo:

  • opzione = com_content
  • visualizza = articolo
  • id = 3
  • catid = 9
  • Itemid = 101

Questi sono valori-campi che Joomla comprende e proverà a restituire il seguente contenuto come:

Eseguirà una query nel componente com_content e utilizzerà una vista articolo per visualizzare l'elemento di contenuto (articolo) con ID 3, della categoria ID 9, utilizzando la voce di menu con ID 101.


Molte varianti di URL per 1 pagina

Tuttavia, lo stesso articolo può essere visualizzato con una combinazione ancora maggiore di campi-valori:

Alcune possibili combinazioni potrebbero essere:

  • index.php? option = com_content & view = article & id = 3 & catid = 9
  • index.php? option = com_content & view = article & id = 3 & Itemid = 101
  • index.php? option = com_content & view = article & id = 3 & Itemid = 102
  • index.php? option = com_content & view = article & id = 3 & Itemid = 103
  • index.php? option = com_content & view = article & id = 3
  • index.php? option = com_content & view = article & id = 3 & lang = it
  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = it

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = it & stampare = 1

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = it & tmpl = componente

Come puoi vedere, tutto quanto sopra richiede gli stessi dati dal sistema, che è l'articolo con id = 3. Ciò porta al fatto che è possibile accedere allo stesso contenuto / pagina attraverso vari URL diversi e in alcuni casi può essere visualizzato in diversi layout.

* Con gli URL SEF abilitati in Joomla, quanto sopra potrebbe potenzialmente tradursi in più di 1 URL SEF per lo stesso articolo / contenuto.



3. La prospettiva SEO

I motori di ricerca moderni e Google in particolare sono consapevoli di questo comportamento. Di solito faranno del loro meglio, per indicizzare e mantenere nei loro risultati di ricerca l'URL più adatto per una pagina. Inoltre, Google ha rivelato che non esiste una " penalità " effettiva per i contenuti duplicati a causa di ciò.

Tuttavia, il problema principale nel caso in cui lo stesso contenuto / pagina sia stato indicizzato più di una volta, è che probabilmente stai perdendo il posizionamento della pagina e le migliori prestazioni SEO possibili , perché il posizionamento della pagina sarà suddiviso in più di 1 pagina anziché 1 .

Con questo in mente, è saggio affrontarlo, invece di lasciare che i motori di ricerca indicizzino gli URL mentre provano a indovinare se URL diversi mostrano lo stesso o diverso contenuto.
Inoltre, controllare i tuoi URL e ciò che SE dovrebbe indicizzare, può aiutarti a produrre una migliore esperienza utente nel suo insieme, poiché gli utenti del sito troveranno la stessa pagina sotto 1 solo URL standard e possono produrre una struttura più solida per un sito Web e la sua gestione .



4. Come gestire i contenuti duplicati

  • Utilizzo di URL canonici per le tue pagine.
    Gli URL Canonical indicheranno al motore di ricerca su quale dovrebbe essere l'URL giusto di una pagina che devono scansionare e conservare nel loro indice.

  • Utilizzando i parametri INDEX / NOINDEX, FOLLOW / NOFOLLOW. Utilizzando tali metadati nelle tue pagine, istruirai i motori di ricerca se vuoi che indicizzino o meno il contenuto di una pagina e seguano o meno i link che vi si trovano.

  • Utilizzando 301 reindirizzamenti / htaccess.
    Puoi reindirizzare tutti gli altri URL a quello che desideri principalmente. Ciò può essere ottenuto con estensioni SEF o htaccess . Entrambi forniscono un grande potere, tuttavia htaccess ha una grande flessibilità considerando la capacità di usare espressioni regolari per tutti i tipi di reindirizzamenti / o riscritture usando mod_rewrite. Per quanto riguarda le estensioni J, quando si presenta la necessità, di solito uso sh404SEF .

    Aggiornamento: Come notato da @Neil Robertson nei commenti: un reindirizzamento importante è dalla versione non www del sito Web alla versione www del sito Web o viceversa. Aggiungilo al file .htaccess per il reindirizzamento da non www a www.

        ### Redirect non-www to www
        RewriteCond %{HTTP_HOST} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Utilizzo degli strumenti per
    i webmaster di Google Gli strumenti per i webmaster di Google dispongono di opzioni per regolare il comportamento del crawler con i parametri dell'URL .

  • Utilizzo di Sitemap
    Invia ai motori di ricerca la struttura dell'URL del tuo sito.

  • Utilizzando il file Robots.txt
    Google e gli altri principali SE rispettano il tuo Robots.txt. Puoi indicare loro di non eseguire la scansione di directory / percorsi URL specifici.

Tutte le opzioni di cui sopra possono essere combinate per produrre il risultato desiderato.

* Come ovunque, quindi in Joomla, una buona pianificazione e organizzazione dei contenuti aiutano sempre a raggiungere un risultato migliore. Soprattutto con Joomla, ciò comporta anche una categorizzazione chiara dei contenuti e una struttura delle voci di menu.



5. Riferimenti e collegamenti

Estensioni SEO di Joomla

Di solito in Joomla se vuoi gestirlo in modo efficiente finiresti per installare un'estensione SEO-SEF di terze parti.



Più lettura:


1
una delle migliori risposte su questo forum :) molto utile. grazie @FFrewin
Joomler il

1
Questa è una risposta eccellente :) Per completezza, potrebbe essere utile aggiungere alcune informazioni sul reindirizzamento della versione non www del sito Web alla versione www del sito Web o viceversa. Questo è spesso dimenticato, ma è probabilmente la causa principale di contenuti duplicati su tutti i siti Web (non solo Joomla).
Neil Robertson,

Sembra che il nuovo router vedrà finalmente la luce del giorno in Joomla 3.8 e questo aiuterà a semplificare gli URL senza bisogno di un'estensione di terze parti.
Neil Robertson,

1
@NeilRobertson: Penso ancora che ci sia ancora spazio per miglioramenti e ci sia bisogno di più lavoro su questo per una soluzione completa ed efficiente per la gestione di URL / duplicati SEF su Joomla.
FFrewin

@FFrewin Sono d'accordo. Sembra che alcune estensioni di terze parti potrebbero dover essere aggiornate per sfruttare il nuovo router.
Neil Robertson,

0

Se ho più voci di menu che hanno lo stesso contenuto, utilizzo Link di sistema / Alias ​​di voci di menu che si trovano in Gestione menu. Ecco un vecchio articolo a riguardo; ma il metodo esiste ancora oggi: https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alias

@Neil, sono d'accordo al 100% sul fatto che i contenuti non www vs www vengano letti come duplicati. Ecco il codice che forza www a non essere www. Inseriscilo nel tuo file htaccess. Inoltre, aggiunge anche il protocollo di sicurezza https. Questo codice non è l'unico metodo, ma è quello che uso con successo su molti siti.

RewriteCond %{HTTP_HOST} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.