Risposte:
Nessun bot che sta raccogliendo email o testando le vulnerabilità del tuo sito rispetterà il tuo robots.txt. In realtà questi robot dannosi guardano il file robots.txt per mappare meglio il tuo sito. Se qualsiasi punto hai un Disallow:
questo verrà utilizzato per attaccare meglio il tuo sito. Un hacker che sta guardando manualmente il tuo sito dovrebbe dedicare più tempo all'esame di tutti i file / directory che stai tentando di non consentire.
robots.txt non aumenterà la sicurezza del tuo sito Web né impedirà la raccolta di indirizzi e-mail. robots.txt è una guida per i motori di ricerca per saltare sezioni del tuo sito web. Questi non saranno indicizzati e dovrebbero essere usati per tutte le sezioni che non vuoi mostrare nei motori di ricerca pubblici.
Tuttavia, ciò non impedirà in alcun modo a nessun altro robot di scaricare l'intero sito per aumentare la sicurezza o impedire la raccolta di e-mail. Per aumentare la sicurezza è necessario aggiungere l'autenticazione e consentire agli utenti autenticati solo oltre le sezioni protette. Per impedire la raccolta di indirizzi e-mail, non inserire e-mail in testo semplice (o testo facilmente decifrabile) su un sito Web.
Il file robots.txt serve solo come richiesta a bot e spider di lasciare solo alcuni contenuti; in realtà non può impedirne l'accesso. I robot "buoni" lo rispetteranno, ma quelli "cattivi" (probabilmente quelli che vuoi bloccare) lo ignoreranno e procederanno comunque.
Invece di robots.txt, forse devi usare i codici CAPTCHA.