Ho notato che Google Webmaster Tools sta segnalando molte risorse bloccate nel mio sito Web. In questo momento tutte le "risorse bloccate" sono .css, .js e immagini (.jpg, .png) che offro da Cloudfront CDN.
Ho passato molto tempo a testare e cercare di capire perché Google non esegue la scansione di questi file e segnala uno stato di "blocco di risorse".
Attualmente offro questi file da diversi nomi host come: cdn1.example.com, cdn2.example.com, ...
cdn1, cdn2 e gli altri sono CNAME per il nome della distribuzione cloudfront.
Test: ho provato a utilizzare direttamente la distribuzione cloudfront (senza CNAME) ma il problema persiste.
Attualmente il mio robots.txt è simile al seguente:
# Google AdSense
User-agent: Mediapartners-Google
Disallow:
#Google images
User-agent: Googlebot-Image
Disallow: /
User-agent: *
Disallow: /homepage
Disallow: /index.php*
Disallow: /uncategorized*
Disallow: /tag/*
Disallow: *feed
Disallow: */page/*
Disallow: *author*
Disallow: *archive*
Disallow: */category*
Disallow: *tag=*
Disallow: /test*
Allow: /
Ed esempi di file bloccati in una pagina di esempio:
cdn1.example.com/wp-content/plugins/wp-forecast/wp-forecast-default.css
cdn9.example.com/wp-content/plugins/bwp-minify/min/?f=wp-content/themes/magazine/css/font-awesome.min.css,wp-content/themes/magazine/css/responsive css
cdn5.example.com/wp-content/themes/magazine/images/nobg.png
cdn6.example.com/wp-content/plugins/floating-social-bar/images/fsb-sprite.png
cdn5.example.com/wp-content/uploads/2013/11/Design-Hotel-3-80x80.jpg
cdn5.example.com/wp-content/uploads/2013/11/Marta-Hotel-7-270x225.jpg
Ho anche provato a consentire tutto in robots.txt ma ho sempre lo stesso risultato.
Ho anche esaminato attentamente le impostazioni di CloudFront su Amazon e non ho visto nulla che potesse essere correlato (non uso e non ho mai usato l'opzione: "Limita accesso al visualizzatore (Usa URL firmati o Cookie firmati)".
In questo momento ho passato molto tempo a esaminare questo aspetto e non ho più idee.
Qualcuno può pensare a un motivo per cui Googlebot sarebbe bloccato dalla scansione dei file ospitati in Amazon CloudFront?
*
alla fine dell'URL "prefisso". /test*
è lo stesso di /test
.