Dovrei usare "Raid 5 + spare" o "Raid 6"?


12

Che cos'è "Raid 5 + Spare" (estratto dal Manuale dell'utente, Sezione 4.17.2, P.54 ):

RAID5 + Spare: RAID 5 + Spare è un array RAID 5 in cui un disco viene utilizzato come ricambio per ricostruire il sistema non appena un disco si guasta (Fig. 79). Sono richiesti almeno quattro dischi. Se un disco fisico si guasta, i dati rimangono disponibili perché vengono letti dai blocchi di parità. I dati da un disco guasto vengono ricostruiti sul disco hot spare. Quando viene sostituito un disco guasto, la sostituzione diventa il nuovo hot spare. Nessun dato viene perso in caso di guasto di un singolo disco, ma se un secondo disco si guasta prima che il sistema possa ricostruire i dati nella riserva di riserva, tutti i dati dell'array andranno persi.


Che cos'è "Raid 6" (estratto dal Manuale dell'utente, Sezione 4.17.2, P.54 ):

RAID6: in RAID 6, i dati sono distribuiti su tutti i dischi (minimo quattro) e due blocchi di parità per ciascun blocco di dati (peq in Fig. 80) sono scritti sullo stesso stripe. Se un disco fisico si guasta, i dati dal disco guasto possono essere ricostruiti su un disco sostitutivo. Questa modalità Raid può supportare fino a due guasti del disco senza perdita di dati. RAID 6 consente una ricostruzione più rapida dei dati da un disco guasto.


Sia "Raid 5 + spare" che "Raid 6" sono così simili ... Non posso dire la differenza.

Quando "Raid 5 + Spare" sarebbe ottimale?

E quando "Raid 6" sarebbe ottimale "?

Il manuale annulla il diverso raid con 5 stelle. "Raid 5 + Spare" ottiene solo 4 stelle ma "Raid 6" ottiene 5 stelle. Se dovessi fidarmi ciecamente del manuale, concluderei che "Raid 6" è sempre meglio. "Raid 6" è sempre meglio?


1
ServerFault ha una buona discussione su questo.
Brian,

1
Qualunque cosa tu stia facendo, esegui un raid solo con un controller raid, non con il soft controller di bordo fornito con il tuo mobo. Se il tuo mobo si spegne, stai chiedendo problemi.
sound2man,

Il raid viene interrotto da un controller hardware (lol ho sentito troppe cose contro i controller del raid software).
Trevor Boyd Smith,

Risposte:


17

In breve:

  • Se la sicurezza è la tua preoccupazione principale, vai con RAID6 in quanto può sopravvivere a due unità guaste contemporaneamente. Se un'unità si guasta in una disposizione di riserva R5 +, non si è al sicuro da un altro guasto fino a quando la riserva non è stata portata alla velocità, il che potrebbe richiedere parecchio tempo con unità di grandi dimensioni (e non è inaudito per un'unità che è stata spenta per secoli, come il tuo ricambio, non riuscire a girare quando finalmente chiamato).

  • Se le prestazioni sono elevate, scegli 5 + di riserva poiché le prestazioni di scrittura saranno migliori quando l'array non si trova in uno stato degradato, sebbene la differenza di prestazioni tra R5 e R6 sia significativamente inferiore alla differenza tra R5 e altre soluzioni se hai un buon controller (cioè una volta che esegue un'operazione di scrittura a blocchi parziale "due / tre letture simultanee quindi calcoli di parità quindi due / tre scritture simultanee" la maggior parte del tempo piuttosto che "leggi-poi-leggi (-quindi-leggi) -quindi-parità -calc-then-write-then-write (-then-write) "che è ciò che possono fare alcuni controller e software RAID molto economici.

Modifica: la prima volta ho perso un punto potenzialmente importante:

  • Se il consumo di energia è un problema, R5 + di riserva avrà un vantaggio in più se il controller mantiene l'unità di riserva spenta fino a quando non è necessaria.

Molto ben scritto / conciso. (Indica i pro / contro evidenti nelle prime due parole di ogni punto elenco ... molto, molto buono).
Trevor Boyd Smith,

Sarei curioso di sapere quando, se mai, il consumo di energia di un singolo disco aggiuntivo sarà davvero una "preoccupazione" rispetto a tutto il resto nel data center / sala server / ecc.
Warren

Una singola unità in una singola macchina, probabilmente no. Ma in colo dove ottieni X-amp-per-rack e paghi molto per qualsiasi eccesso (o l'eccesso non è semplicemente consentito - a volte se vai oltre ti oscuri), potrebbe essere evidente. Anche il potere "consumato" è un doppio whammy: viene convertito in rumore e calore e si finisce per aver bisogno di più energia per allontanare il calore. E per un'intera gabbia o un set più grande di kit l'estrazione totale di un'unità aggiuntiva per unità di calcolo si aggiunge presto a qualcosa che un contabile sufficientemente esigente potrebbe notare.
David Spillett,

7

RAID 5 + hot spare:

  • su hardware controller uguale prestazioni migliori rispetto a RAID 6
  • non puoi perdere 2 dischi contemporaneamente . quando si perde un disco, c'è un tempo di ricostruzione (con l'hot spare) in cui non si ha ridondanza . Tutto ciò che fallisce in questo momento crea una perdita completa (a meno di inviare nulla a una buona impresa di salvataggio di dati e pagare davvero $$$$)

RAID 6:

  • prestazioni peggiori di RAID 5 (a seconda del controller può variare da molto evidente a praticamente nessuna differenza)
  • puoi perdere 2 dischi contemporaneamente

Per qualsiasi RAID 5 o 6 devi fare attenzione a usare dischi che non appartengono alla stessa esecuzione di produzione. Può succedere (l'ho visto!) Che dopo un singolo errore al momento della ricostruzione, i dischi successivi falliscono a causa dell'aumento dello stress. I dischi della stessa esecuzione hanno lo stesso firmware esatto e probabilmente proprietà fisiche molto simili.

Modifica: cosa scegliere

(Ciò dipende anche dai requisiti di prestazioni del server e dal rischio tollerabile.)

Se l'ambiente dei server è abbastanza buono per l'hardware (colo, climatizzato ecc.), Con RAID5 + hot spare starai bene.

Se l'ambiente rende più probabile la rottura di più di un disco in breve tempo (vibrazioni, umidità, sporco), scegliere RAID 6.

Avere sempre anche un backup adeguato e ripristinare il test.

Modifica 2: i controller RAID decenti hanno il lavaggio , che verifica periodicamente tutti i settori.


+1 per "avere un backup adeguato e testare il recupero". Questa è la PRIMA cosa che tutti dovrebbero avere prima di iniziare a preoccuparsi dei livelli RAID.
Warren

3

RAID5 utilizza una striscia di parità. È necessario calcolare la correzione degli errori di Reed Solomon e scrivere due strisce per RAID6 rispetto a una per RAID5. RAID5 è utilizzato per intense applicazioni di database in cui l'archiviazione è enorme a causa del costo di RAID10. Il costo di RAID5 varia dal 67% al 94% di disponibilità del disco, dove RAID10 è del 50% (costi di archiviazione molto più elevati) Mentre RAID6 ha una latenza di lettura inferiore di una quantità molto piccola a causa della latenza di rotazione, RAID6 è più lento del 25-31% nelle scritture a causa di il calcolo della correzione degli errori e la scrittura aggiuntiva del bit di parità.

Utilizzando il tempo medio tra guasti (MTBF) per le unità, la probabilità che due unità si guastino una dopo l'altra o allo stesso tempo è circa (0.1% x 0.1%)*12o 0.001 x 0.001 * 12; se hai 1000 unità in esecuzione, perderai in media ~ 1,2 unità all'anno. Due unità si guasteranno una dopo l'altra ogni 8,3 anni circa. Ora, poiché il guasto dell'unità non è una distribuzione di Poisson a causa dei carichi pesanti sull'unità durante la ricostruzione, è più probabile che si verifichi un guasto di una seconda unità durante questo periodo e la distribuzione è più vicina a una distribuzione Gamma con valori leggermente più alti dopo un si verifica un errore.

La linea di fondo è che le prestazioni per RAID5 sono superiori a RAID6 nelle scritture e per l'applicazione DB - molto meglio. Per un'applicazione per la maggior parte letta come un server Web, non fa alcuna differenza e dovresti usare RAID6. I vantaggi in termini di costi derivanti dall'utilizzo di RAID5 su RAID10 sono enormi per l'archiviazione di grandi dimensioni. Se puoi permetterti il ​​sovraccarico, usa RAID10 per applicazioni ad alta intensità di disco. RAID10 funzionerà sempre meglio.

La più grande linea di fondo persa è che il RAID NON è il backup, ma un modo per limitare i tempi di inattività fornendo ridondanza. Se i dati sono critici, è necessario eseguirne il backup (e testare il processo di recupero).

Se un array RAID di 10 unità SAS da 2 TB si guasta, il ripristino avrà un costo di migliaia di dollari e richiederà settimane per il ripristino, se è possibile.

Tutti gli array RAID alla fine falliscono!


1

Parlando rigorosamente dal punto di vista dell'integrità dei dati, sì. Si può perdere in modo sicuro qualsiasi due unità, anche se è un evento raro per perdere due insieme a corto di grave trauma fisico al sistema.

Finanziariamente, non tanto. L'hot spare può essere spento fino a quando necessario, il che significa che non utilizza energia e non comporta usura.

E come sempre, RAID non è un sostituto per un adeguato piano di backup fuori sede.


1

Hai considerato 10? Se hai abbastanza dischi per il raid 6, hai abbastanza per fare un volume di 10. Nella maggior parte dei casi, 10 è più veloce e più ridondante (a scapito di spazio su disco).


10 supporta solo 4 dischi. quindi il raid 10 non è un'opzione IMO.
Trevor Boyd Smith,

1
@Trevor Raid 10 supporta qualsiasi numero pari di dischi> = 4. Se riesci a fare il raid 6, puoi fare il raid 10.
Joel Coehoorn,

1

Queste risposte sembrano errate perché si basano SOLO sulle prestazioni teoriche dell'unità. Considera, se hai un controller RAID con 1 GB di cache, la scrittura (di solito sotto carico normale - non uno scenario di carico elevato non normale) è immediata dal punto di vista dell'utente o dell'applicazione - è passata alla memoria e quindi al la scrittura "effettiva" si verifica durante l'esecuzione dell'unità.

Tuttavia, la lettura non può essere "falsificata" (velocizzata con una cache) a meno che gli stessi dati non siano stati caricati di recente o abitualmente. Raid 6 è migliore per la lettura ed è più tollerante (2 contro un'unità). Raid 5 è una scrittura più lenta e molto lenta durante la ricostruzione.

Quindi, mentre RAID 5 sarebbe lento nella scrittura effettiva, sarà nascosto con un buon controller raid - dove la scrittura avviene in memoria dal punto di vista dell'utente / dell'applicazione. Tuttavia, Raid 5 ha una lettura più lenta rispetto al raid 6 e ciò non verrà migliorato con un controller a meno che i dati non siano già stati caricati o un algoritmo mantenga una registrazione di letture ripetute. Nella vita reale - il raid 6 vince.

In conclusione, la scrittura di Raid 5 è lenta ma nascosta con un buon controller e questo rende il raid 5 o 6 sostanzialmente lo stesso con le prestazioni "percepite" nella scrittura (ci sono alcune eccezioni). Tuttavia, Raid 6 legge più velocemente e i controller probabilmente non aiuteranno in un carico di lavoro reale per migliorare le prestazioni di lettura. Ora aggiungi che Raid 6 può subire due fallimenti e Raid 5 + 1 solo uno diventa facile scegliere Raid 6 come opzione migliore: non dimenticare che anche la ricostruzione di Raid 5 è molto lenta. Ho anche appreso che le unità Raid 6 vengono utilizzate (quindi testate nel modo giusto) e le unità che falliscono tendono a guastarsi molto rapidamente. Una volta che un array è attivo da più di 30 giorni, tende a durare per anni. Un hot spare non è stato testato e potrebbe effettivamente non funzionare immediatamente quando necessario.


0

Questi sono i fatti del caso e sono indiscussi (da chiunque sappia di cosa stanno parlando):

  1. RAID5 + hotspare è, letteralmente, la peggiore scelta RAID che puoi scegliere.
  2. RAID10 dovrebbe essere la scelta predefinita se ti interessano i tuoi dati (il che significa che dipendi da essi, ad esempio, per far andare avanti la tua attività).

Se consideri tutte le possibili opzioni RAID, non esiste alcun caso in cui RAID5 + hotspare sia la scelta migliore, principalmente perché se hai RAID5 + hotspare, significa che hai 4 unità e con 4 unità puoi fare RAID6, o anche meglio, puoi fare RAID10.

Con 4 unità ottieni lo stesso spazio di archiviazione utilizzabile tra tutte le opzioni (R5 + HS, R6, R10).

Se il tuo obiettivo è la prestazione, RAID10 sarà superiore a RAID5 e RAID6.

Se il tuo obiettivo è la sicurezza, RAID6 o RAID10 sono superiori a RAID5 con o senza hotspare. È discutibile quale sia più sicuro (6 vs 10). RAID6 può sostenere 2 guasti dell'unità, ma a causa di errori di lettura irrecuperabili (URE), è anche possibile che un singolo guasto dell'unità in un RAID6 uccida l'intero array.

RAID10, poiché non è basato sulla parità, non presenta lo stesso problema con gli URE. Se un RAID di parità (R5, ecc.) Perde un'unità e quindi incontra un URE, l'intero array viene perso. Con RAID1 o RAID10, se un'unità viene persa e viene rilevato un URE sul disco mirror, viene perso solo il settore illeggibile.

Vedi qui per una spiegazione dettagliata del perché RAID5 è la scelta peggiore possibile . Vedi anche qui per un elenco di scelte RAID ragionevoli per numero di unità . Si noti che in nessun caso RAID5 è la scelta migliore (indipendentemente da hotspare).


2
Non sono d'accordo. RAID5 ha i suoi usi. (ad esempio quando un budget è limitato e hai davvero bisogno di spazio su disco). E dal momento che RAID non sostituisce un backup sopravvissuto a un guasto del disco è abbastanza per farti andare avanti fino alle 17:00, a quel punto le persone lasciano l'ufficio e fai la manutenzione delle emergenze.
Hennes,

C'è una differenza tra "la scelta migliore" e "la scelta migliore che puoi permetterti". RAID5 non è mai la scelta migliore, mai. Le persone vengono qui per ottenere la risposta migliore e le persone dovrebbero andarsene sapendo che RAID5 è sempre meno del meglio. È matematicamente dimostrabile che in alcuni casi RAID0 è più affidabile di RAID5. Ecco come è spaventoso RAID5. In molti casi, il RAID5 potrebbe non arrivare alle 17:00. C'è una grande differenza tra teoria e mondo reale quando si tratta di RAID5. Vedi qui
user1594322

Non mi è affatto chiaro perché dici che un RAID10 non ha lo stesso problema con gli URE. Con una configurazione RAID10 a quattro unità, se si perde un'unità e si subisce un URE sul relativo mirror, si è ugualmente curati.
ChrisInEdmonton,

Se RAID10 ha un'unità guasta e quindi ha un URE sull'unità sopravvissuta, si perde solo il settore illeggibile, non l'intero array. Aggiornato la risposta.
user1594322
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.