Sto per riorganizzare tutti i miei HDD nel mio nas box di Linux e vorrei usare mdadm raid per la protezione dei dati e la sua flessibilità per rimodellare gli array. Tuttavia, prima di usare mdadm per questo mi piacerebbe sapere come gestisce il marciume dei bit . In particolare i tipi di bit rot che non comportano l'invio di messaggi di errore di lettura irrecuperabili dall'HDD.
Dato che probabilmente userò almeno 21 TB di HDD in 8 dischi nel nas e le varie citazioni sulle probabilità di guasti sugli HDD, sto pensando che durante una ricostruzione da un singolo errore del disco ho ragionevolmente probabilità di incontrare una qualche forma di marcescenza dei bit sui dischi rimanenti. Se si tratta di un errore di lettura irrecuperabile su 1 delle unità, che l'unità in realtà lo segnala come un errore, credo che dovrebbe andare bene con raid6 (vero?). Tuttavia, se i dati letti dal disco sono errati ma non riportati come tali dal disco, non riesco a vedere come questo possa essere corretto automaticamente anche con raid6. È qualcosa di cui dobbiamo preoccuparci? Visto l'articolo È il 2010 e RAID5 funziona ancorae le mie esperienze di successo a casa e al lavoro, le cose non sono necessariamente così difficili come le parole d'ordine e il marketing ci vorrebbero far credere, ma odio dover ripristinare dai backup solo perché un HDD non è riuscito.
Dato che i modelli di utilizzo saranno, scrivere al massimo alcune volte e leggere occasionalmente, dovrò eseguire lo scrubbing dei dati . Vedo sul wiki di archlinux i comandi mdadm per i dati che puliscono un array come
echo check > /sys/block/md0/md/sync_action
quindi per monitorare l'avanzamento
cat /proc/mdstat
Questo mi sembra che leggerà tutti i settori di tutti i dischi e verificherà che i dati corrispondano alla parità e viceversa. Anche se noto che c'è una forte enfasi nei documenti per dire che ci sono circostanze significative che l'operazione di "controllo" non sarà in grado di correggere automaticamente, rileverà e lascerà all'utente la correzione.
Quali livelli RAID mdadm dovrei scegliere per massimizzare la mia protezione da marciume bit e quali interventi di manutenzione e di protezione dovrei fare? E da cosa non mi proteggerà?
Modifica: non sto cercando di avviare un RAID vs ZFS o qualsiasi altro QA tecnologico. Voglio sapere specificamente del raid di mdadm. Questo è anche il motivo per cui lo sto chiedendo su Unix e Linux e non su SuperUser .
Modifica: è la risposta: mdadm può correggere solo gli URE che vengono segnalati dai sistemi a disco durante uno scrub dei dati e rilevare un marcio di bit silenzioso durante uno scrub ma non è possibile / non risolverlo?