Ho un server Linux con molti dischi da 2 TB, tutti attualmente in un LVM con circa 10 TB di spazio. Uso tutto questo spazio su una partizione ext4 e attualmente ho circa 8,8 TB di dati.
Il problema è che spesso ricevo errori sui miei dischi e anche se li sostituisco (vale a dire copio il vecchio disco su uno nuovo con dd, quindi inserisco quello nuovo sul server) non appena compaiono errori, Ricevo spesso circa 100 MB di dati corrotti su di esso. Questo fa impazzire e2fsck ogni volta, e spesso ci vuole una settimana per riportare il filesystem ext4 in uno stato sano.
Quindi la domanda è: cosa mi consiglieresti di usare come filesystem sul mio LVM? O cosa mi consiglieresti di fare invece (non ho davvero bisogno di LVM)?
Profilo del mio filesystem:
- molte cartelle di dimensioni totali diverse (alcune per un totale di 2 TB, altre per un totale di 100 MB)
- quasi 200.000 file con dimensioni diverse (3/4 dei quali circa 10 MB, 1/4 tra 100 MB e 4 GB; al momento non riesco a ottenere più statistiche sui file poiché la mia partizione ext4 è completamente distrutta per alcuni giorni)
- molte letture ma poche scritture
- e ho bisogno di tolleranza d'errore (ho smesso di usare mdadm RAID perché non mi piace avere UN errore su tutto il disco, e qualche volta ho dei dischi guasti, che sostituisco appena posso, ma ciò significa che posso ottenere dati corrotti su il mio filesystem)
Il problema principale sono i dischi guasti; Posso perdere alcuni file, ma non posso permettermi di perdere tutto allo stesso tempo.
Se continuo a usare ext4, ho sentito che dovrei provare a creare file system più piccoli e "unirli" in qualche modo, ma non so come.
Ho sentito che btrfs sarebbe carino, ma non riesco a trovare alcun indizio su come riesca a perdere una parte di un disco (o un intero disco), quando i dati NON vengono replicati ( mkfs.btrfs -d single
?).
Qualsiasi consiglio sulla domanda sarà il benvenuto, grazie in anticipo!