Trasferisco costantemente immagini di dischi e immagini di macchine virtuali (di solito da 800 GB a quasi 1 TB per file) su un server cloud tramite rclone tramite SSH, e mi chiedo quanto siano affidabili sha1sum e md5sum quando si tratta di verificare l'integrità di file molto grandi.
Ho trovato questo: come posso verificare che un file da 1 TB sia stato trasferito correttamente?
Tuttavia ha a che fare con le prestazioni piuttosto che con l'affidabilità degli hash generati.
Potrebbe esserci la possibilità che un altro file condivida gli stessi hash generati considerando che ci sono così tanti file distinti là fuori?
Quindi, quanto sono affidabili le somme MD5 e SHA-1 su file molto grandi? Grazie.
Ho anche scoperto questo riguardo alla collisione: https://stackoverflow.com/questions/4032209/is-md5-still-good-enough-to-uniquely-identify-files
https://www.theregister.co.uk/2017/02/23/google_first_sha1_collision/