Strategia RAID - 8 unità da 1 TB


8

Sto configurando un dispositivo di archiviazione di backup. Questa macchina ha Windows Server 2008, su un'unità di avvio separata.

Dispone di 8 unità da 1 TB e utilizza una scheda RAID hardware.

La mia domanda è: quale configurazione RAID dovrei scegliere?

Inizialmente stavo per andare con RAID 5 su tutte e 8 le unità, tuttavia i membri su serverFault lo hanno sconsigliato. Mi stavo solo chiedendo perché?

Alcune persone hanno suggerito 2 lotti di configurazione RAID 5 su 4 delle unità, quindi li striping ...

Voglio massimizzare lo spazio di archiviazione, poiché si tratta di un'unità di backup - memorizzerà backup SQL, immagini Acronis, file, ecc ... Non sarà per l'accesso pubblico, quindi l'I / O non sarà così alto I non penserei.


7
ZFS è quello che vuoi davvero :)
Bill Weiss,

Risposte:


19

Per puro backup a freddo direi che RAID5 va bene. RAID5 richiederà un notevole lasso di tempo per il ripristino su unità SATA da 8x1 TB, ma date le possibilità che si verifichi un guasto a IOPS bassi che probabilmente non è critico. Se vuoi un po 'di sicurezza in più, scegli RAID6 che ti darà la possibilità di sopravvivere a due guasti simultanei del disco.


3
Attualmente sto utilizzando un RAID6 con 8 unità da 1 TB e funziona in modo eccellente.
phuzion

6
+1 per il suggerimento di Raid 6
Aaron

1
+1 RAID 6. In questa applicazione, le prestazioni di solito non sono così importanti. Se sei preoccupato per i tempi di recupero, a seconda dei tuoi dati, RAID 10 con compressione potrebbe produrre lo spazio di archiviazione di cui hai bisogno e abbreviare i tempi di ricostruzione.
Duffbeer703,

un altro +1 per RAID6. Ho 7x750GB in RAID6, e funziona abbastanza bene (e ho fatto morire le unità un paio di volte e si è ripreso bene).
James Cassell,

4
Esiste una probabilità del 60% circa di un errore di lettura irrecuperabile durante la ricostruzione di un array RAID5 a 8 dischi composto da unità da 1 TB. RAID6 e RAID10 sono le uniche opzioni tradizionali sicure in questo scenario, ma quello che vuoi davvero è RAIDZ2. Ulteriori informazioni sugli array RAID5 di grandi dimensioni e sugli errori di lettura irrecuperabili.
Skyhawk,

15

Ecco un buon articolo su: Perché RAID 5 smette di funzionare nel 2009

Ecco un breve riassunto:

  • Disk Failure: con 7 dischi hai una probabilità del 20% di vedere un errore del disco in un anno. È molto probabile che si verifichi un errore durante la vita operativa dell'archiviazione.
  • Errori di lettura: "Le unità SATA sono comunemente specificate con un tasso di errore di lettura (URE) irrecuperabile di 10 ^ 14". Ciò significa che per un ipotetico 12 TB di spazio di archiviazione è probabile che vengano visualizzati errori di lettura. Questa è solo una funzione della crescente quantità di memoria che viene comunemente utilizzata. Più spazio di archiviazione, più errori di lettura.

Funziona in questo modo secondo l'autore: Più dischi (maggiore probabilità di errore del disco) + più spazio su disco (maggiore probabilità di errore di lettura) = Maggiore probabilità che si verifichino entrambi gli eventi contemporaneamente . Ciò che ucciderà l'array RAID è quando un disco si guasta e durante la ricostruzione dell'array si verifica un errore di lettura.

La soluzione dell'autore: RAID-6

Ecco un commento che sembra riassumere piuttosto bene:

Il punto chiave che sembra mancare in molti dei commenti è che quando un disco si guasta in un array RAID 5 e deve essere ricostruito, c'è una significativa possibilità di un errore di lettura non recuperabile durante la ricostruzione (BER / UER). Poiché non vi è più ridondanza che l'array RAID non può ricostruire, ciò non dipende dal fatto che si stia eseguendo Windows o Linux, hardware o software RAID 5, è semplice matematica. Un controller RAID onesto registrerà questo e generalmente interromperà, consentendo di ripristinare i dati non danneggiati dal backup su un nuovo array.

Note del redattore: è possibile utilizzare solo unità SCSI o SAS di qualità ...


1
Buon articolo e buon punto. Mi imbatto in un sacco di folklore e conoscenza tribale su RAID che non è supportato dalla matematica. È fondamentale comprendere la logica e le probabilità RAID.
inizio

C'è un buon punto sollevato in questo articolo ma non posso essere d'accordo con le conclusioni. L'autore afferma che RAID-6 non è nemmeno una soluzione e ho messo in dubbio la validità di questa affermazione.
dtoubelis,

Riepilogo molto bello. Ho appena creato un array RAID5 da 13 TB e sembra essere una pessima soluzione
Jan Zahradník,

Lo stesso autore ha scritto "Perché RAID 6 smette di funzionare nel 2019"

5

Se si opta per RAID 5, si subirà un panico straziante per circa un giorno mentre l'array viene ricostruito per includerne la sostituzione. Se scegli RAID 6, quando un'unità si guasta, puoi permetterti un ulteriore errore durante la ricostruzione, in modo che il panico da arresto cardiaco si riduca a un semplice lieve allarme.

Se fossi in me, andrei per 6 - ma poi ho problemi con la pressione sanguigna a volte così com'è ...


3

La mia raccomandazione è senza dubbio RAID-6. Soprattutto considerando che si stanno utilizzando unità da 1 TB.

Ecco la mia esperienza Negli ultimi 4-5 anni abbiamo eseguito 3 array RAID-5 con unità da 2 TB - 2 per 5x e 1 per 10x (spero di non essere criptico qui :-). Durante questo periodo abbiamo riscontrato 3 o 4 guasti al disco rigido. Solo una volta l'array è stato ricostruito senza problemi. Tutte le altre volte ci sono stati errori durante la ricostruzione. Uno di questi è stato catastrofico e ci è costato $ 12.000 in commissioni per la società di ripristino dei dati. La gravità di un errore dipendeva fortemente dall'intelligenza del software / firmware RAID. L'errore catastrofico si è verificato con il software RAID Linux. Gli errori recuperabili si sono verificati con il controller hardware Adaptec. (In sostanza segna solo una striscia come cattiva se scopre un URE e poi continua. fsckDopo la ricostruzione e si è di nuovo in affari. È possibile perdere file o due ma non l'intero array.)

Da allora abbiamo migrato i nostri dati su array RAID-6 con buoni controller hardware. Qualche mese fa abbiamo riscontrato un guasto alla prima unità e il recupero è stato un problema.

Molti giustificheranno l'uso di RAID-5 vs RAID-6 per motivi di prestazioni (sto citando parzialmente la mia risposta a un altro thread qui), ... questa differenza di prestazioni è TEORICA. Dalla mia esperienza, la differenza di prestazioni REALE tra RAID-6 e RAID-5 è trascurabile o inesistente. Sto parlando di RAID hardware con controller decente con almeno 8 unità e sistema con memoria sufficiente per fornire una buona memorizzazione nella cache. In questa configurazione la velocità di scrittura è probabilmente limitata dalla larghezza di banda del bus SATA / SAS / SCSI ...

Un altro aspetto negativo o RAID-6 è il costo di questa unità aggiuntiva. Ma lascia che lo metta in prospettiva. Probabilmente pagheresti $ 200-500 in più per unità extra ma ti preghiamo di confrontare questo con il costo dei tempi di inattività o le spese di recupero se qualcosa va storto ... Considera questo come un premio assicurativo :-)


1

Direi di utilizzare Raid5 su 7 dischi e di conservarne uno come HS. Ma tutto dipende davvero dal controller raid che stai utilizzando e dal tipo e dalla qualità delle tue unità.


1
Perché sprecare un disco che potrebbe essere facilmente utilizzato per migliorare la capacità o la tolleranza agli errori?
Nic

se pensi che i dischi hotspare siano uno spreco, non c'è molto altro che posso dirti.
Dagli

Sono disposto a essere convinto, quindi ho creato una nuova domanda sull'argomento.
Nic

1

Dovrai capire quanto valgono i tuoi dati, in dollari del mondo reale e quanto sarà fastidioso o costoso un errore prima di poter pensare alle strategie di archiviazione. Un suggerimento è che la risposta non può essere "nessuna perdita", perché ha un costo infinito.

Usa quel costo / tempo / dati per guidare per quanto tempo puoi tollerare una ricostruzione, o quante ore il sistema può essere inattivo, o quanti soldi vuoi spendere per l'hardware.


0

Sul mio filer eseguo un raid software 5 su otto unità s-ata da 500 GB, che funziona alla grande. Prestazioni in lettura vicino a 160 MB / s prestazioni in scrittura circa 90 MB / s. Il tempo di recupero è di circa 20 ore. Chipset Athlon X2 4200+ e nvidia.

Poiché questo deve essere utilizzato per l'archiviazione di backup, non vedo la necessità del raid 6. È improbabile che due unità sul raid di backup si guastino entro pochi giorni, allo stesso tempo in cui i dati di produzione vengono danneggiati o persi.


0

RAID5 su 8 dischi dovrebbe andare bene tranne che avrà scarse prestazioni di scrittura in quanto deve calcolare il bit di perità. Le prestazioni di lettura dovrebbero essere davvero eccezionali.

Sono abbastanza sicuro che il numero massimo consigliato di dischi per RAID5 sia 12, ma tutto dipende da come stai usando l'array se puoi usarne tanti, più dischi aggiungi più lentamente saranno la tua ricostruzione e le tue scritture.


1
Sei wronjg. Adaptec supporta più di 12 dischi su un Raid 5.
TomTom il

C'è una differenza tra ciò che è supportato e ciò che è raccomandato come pratico per un ambiente di produzione. Stavo facendo una raccomandazione non dichiarando un fatto quantitativo.
ITGuy24,

Non ho mai visto un numero così alto per il numero "consigliato" di dischi, ma sono sempre passato di 6 o meno solo perché i dischi adorano morire in gruppo. Più di 12 ti espongono a molte potenziali perdite di dati.
Matteo,

0

Se è puramente a scopo di backup e IO non ha importanza, il raid 5 dovrebbe andare bene, il raid 6 sarebbe ancora meglio ma perderai spazio di archiviazione. Quanto sono importanti i tuoi dati? Puoi anche fare raid 5 + 0 composto da due Raid 5 a 4 dischi. Questo ti permetterebbe di perdere 2 dischi, darti un IO migliore e ti lascerebbe con circa 6 TB utilizzabili, ma c'è una buona possibilità che il tuo controller non lo supporti (di solito richiede roba di fascia più alta). Raid 6 è la più lenta di tutte le opzioni, ti fa perdere 2 dischi e ti lascerà comunque con circa 6 TB utilizzabili.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.