Che cos'è un file robots.txt minimo valido?


14

Non mi piace il fatto che vedo molti errori 404 in access.log del mio server web. Ricevo questi errori perché i crawler provano ad aprire un file robots.txt , ma non sono riuscito a trovarne. Quindi voglio inserire un semplice file robots.txt che impedirà la visualizzazione degli errori 404 nel mio file di registro.

Qual è un file robots.txt minimo valido che consentirà la scansione di tutto il sito?

Risposte:


17

Come indicato qui , crea un file di testo chiamato robots.txt nella directory di livello superiore del tuo server web. Puoi lasciarlo vuoto o aggiungere:

User-agent: *
Disallow:

Se vuoi che i robot eseguano la scansione di tutto . In caso contrario, vedere il link sopra per ulteriori esempi.


Perché aggiungere "Disallow:" e non solo "Allow: *"?
Athoxx,

2
@Patrik "Consenti" serve per sovrascrivere qualsiasi precedente direttiva "Non consentire". Non ha senso se non c'è "Non consentire". Onestamente la soluzione migliore è un file vuoto.
Disgruntled

2
Ah, capisco. Concordo anche sul fatto che un file vuoto sia il migliore.
Athoxx,

2
@PatrikAlienus Perché "Allow" non è nella specifica robots.txt.
user11153

1
@ user11153: Eh? Che dire della sezione "3.2.2 Le linee Consenti e Non consentire" della specifica Draft Internet del 1997 Un metodo per il controllo dei robot Web ?
David Cary,

2

Il minimo indispensabile robots.txtè un file completamente vuoto.

Qualsiasi altra direttiva "nulla" come una vuota Disallowo Allow: *non è solo inutile perché non attiva, ma aggiunge complessità non necessaria.

Se non vuoi che il file sia completamente vuoto - o vuoi renderlo più leggibile dall'uomo - aggiungi semplicemente un commento che inizia con il #personaggio, come # blank file allows all. I crawler ignorano le linee che iniziano con #.


0

Direi questo;

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

Consentirà a Google di eseguire la scansione di tutto, ma non consentirà a Google di eseguire la scansione del pannello di amministrazione. Qual è la situazione ideale per te.


2
Forse mi manca qualcosa, ma non credo che il richiedente abbia detto che stanno usando Wordpress.
Maximillian Laumeister,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.