Se RAID5 / 6 sono rischiosi a causa di URE, anche gli schemi di backup / ripristino completi sono a rischio?


11

A quanto ho capito, hai un'alta probabilità di incontrare un URE durante una ricostruzione a causa della necessità di leggere una grande quantità di dati per eseguire l'attività.

Questo problema riguarda anche il backup e il ripristino di scenari con grandi quantità di dati? Se è necessario eseguire un ripristino completo da un backup di 10 TB, gli URE sembrano altrettanto probabili.


3
Non è davvero un problema con RAID6 e RAID non è pensato per il backup, ma per la disponibilità.
user9517

Un backup non è sufficiente.
Ripristina Monica - M. Schröder,

Risposte:


13

Il vero problema di URE e RAID5 è che, dopo aver incontrato anche un solo URE, molti controller hardware interrompono semplicemente la ricostruzione del RAID e dichiarano la morte dell'array, mettendo tutti i dati offline. Sebbene questa sia la "scommessa più sicura" per quanto riguarda il potenziale danneggiamento dei dati, non è sempre la cosa migliore da fare (ad esempio: pensare a un URE che colpisce un settore di dati libero / non allocato dal filesystem. Mentre dovrebbe essere sicuro di ignorare esso, il controller hardware metterà offline l'intero array).

RAID6 è molto meno incline a URE, poiché la ridondanza a due dischi riduce davvero la possibilità di avere URE simultanei nello stesso settore disco / LBA.

Allo stesso tempo, il software RAID (ad es. Mdadm) è generalmente molto più flessibile del RAID hardware, consentendo il recupero dell'array RAID5 degradato anche quando vengono rilevati alcuni URE.

Ripristino dal backup, in genere sono presenti strumenti più flessibili; ciò significa che, nel caso comune, è possibile saltare i settori danneggiati / illeggibili e procedere con il recupero di altri dati.


3

Qualunque cosa sul volume è a rischio

Se si afferma di avere una preoccupazione per quanto riguarda URE su un volume / LUN che ha subito un guasto dell'unità RAID 5/6, tutti i dati su quel volume sarebbero a rischio.

Assicurati di archiviare i tuoi dati su un volume / LUN diverso da quello su cui è archiviato il backup. Le migliori pratiche indicano che il backup è su un dispositivo di archiviazione completamente diverso rispetto ai dati di produzione.

URE è in genere a livello di blocco, quindi qualsiasi cosa su quel volume sarebbe a rischio di corruzione. Il formato a livello di blocco è basso nello stack. NTFS o VMFS (qualsiasi formato) passa a livello di blocco e così via. Poiché il livello di blocco sul volume RAID si trova al di sotto di tutto, tutti i dati su di esso sono influenzati da problemi a livello di blocco.

Spero di rispondere correttamente alla tua domanda.


3

In linea di principio sì, ma se si archivia il backup su un RAID6 (come esempio), si avrà il vantaggio della ridondanza, quindi il tasso di errore totale sarà molto più basso e con esso la possibilità di un URE durante il ripristino.

Se si utilizza una soluzione di backup su nastro, i tassi di errore sono molto più bassi all'inizio (SAS: 1x10 ^ -15 - 1x10 ^ -16, LTO7: 1x10 ^ -19).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.