Le versioni più recenti di Joomla non bloccano più le cartelle /media/
e /templates/
:
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
Non tutte le estensioni aderiscono alle linee guida su dove posizionare i file CSS e JS ecc., Quindi una buona soluzione è consentire a Google di accedere a questi file indipendentemente da dove si trovano.
Puoi farlo inserendo alcune righe all'inizio del tuo robots.txt
file in questo modo:
#Googlebot
User-agent: Googlebot
Allow: *.css
Allow: *.js
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
MODIFICARE:
Grazie @ w3dk e @Stephen Ostermiller per il feedback! Hai abbastanza ragione. È meglio fare qualcosa del genere:
User-agent: *
Allow: *.css
Allow: *.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
Sfortunatamente questo non sembra funzionare come previsto perché le regole più lunghe (più specifiche) sovrascrivono le regole più brevi e le linee consentite vengono ignorate. Non sembra fare alcuna differenza se le linee consentite seguono le linee non autorizzate o viceversa.
L'unico modo in cui riesco a aggirare questo è facendo qualcosa del genere che sembra funzionare quando lo collaudo in Strumenti per i Webmaster:
User-agent: *
Allow: /************************************************************.css
Allow: /************************************************************.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
EDIT 2 - MIGLIORE SOLUZIONE:
OK, quindi ho fatto qualche ricerca in più e ho trovato la risposta su https://stackoverflow.com/a/30362942/1983389
Sembra la soluzione più corretta e più supportato in tutti i web crawler è qualcosa di simile alla seguente (che permette l'accesso a *.css
e *.js
file nei /bin
, /cache
, /installation
, /language
, /logs
, e /tmp
le cartelle e, eventualmente, alcuni degli altri cartelle ha poco senso):
User-agent: *
Allow: /administrator/*.css
Allow: /administrator/*.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Allow: /cli/*.css
Allow: /cli/*.js
Disallow: /cli/
Allow: /components/*.css
Allow: /components/*.js
Disallow: /components/
Allow: /includes/*.css
Allow: /includes/*.js
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Allow: /layouts/*.css
Allow: /layouts/*.js
Disallow: /layouts/
Allow: /libraries/*.css
Allow: /libraries/*.js
Disallow: /libraries/
Disallow: /logs/
Allow: /modules/*.css
Allow: /modules/*.js
Disallow: /modules/
Allow: /plugins/*.css
Allow: /plugins/*.js
Disallow: /plugins/
Disallow: /tmp/
robots.txt
poiché nessuno (nemmeno i motori di ricerca ora che Google sta facendo richieste su ciò che non si dovrebbe impedire) lo seguirà comunque?