Devo RAID card Fusion-io?


27

Posso funzionare in modo affidabile con una singola scheda Fusion-io installata in un server o devo distribuire due schede in una configurazione RAID del software?

Fusion-io non è molto chiaro (quasi fuorviante) sull'argomento durante la revisione dei loro materiali di marketing Dato il costo delle carte, sono curioso di sapere come altri ingegneri le dispiegano in scenari del mondo reale.

Ho intenzione di utilizzare la scheda Fusion-io ioDrive2 da 1,2 TB con marchio HP per una soluzione di database standalone proprietaria in esecuzione su Linux. Questa è una configurazione a server singolo senza alcuna reale opzione di disponibilità elevata. Esiste una replica asincrona con un RPO di 10 minuti che rispecchia i registri delle transazioni su un secondo server fisico.

Tradizionalmente, vorrei specificare un server HP ProLiant di fascia alta con la CPU più avanzata per questa applicazione. Devo andare su SSD e sono in grado di acquisire Fusion-io a un prezzo inferiore rispetto all'SSD SAS aziendale per la capacità richiesta.

  • Devo eseguire due schede ioDrive2 e unirle con il software RAID (md o ZFS) o non è necessario?
  • Dovrei essere preoccupato per l'errore Fusion-io più di quanto non sarei preoccupato per un errore del controller RAID o un errore della scheda madre?
  • Gli amministratori di sistema come RAID. Ciò richiede una mentalità diversa, data la diversa interfaccia e il livello di usura / correzione degli errori disponibili su questo fattore di forma?
  • Qual è il tasso di fallimento di questi dispositivi?

Modifica: ho appena letto un white paper sull'affidabilità Fusion-io di Dell e il take-away sembra essere "Le schede Fusion-io hanno molti ridondanze interne ... Non preoccuparti di RAID !!" .


Il raid del software e / o il bus PCIe riusciranno anche a tenere il passo se stai spingendo il limite IOPS? Onestamente non ne ho idea, ma vale la pena dare un'occhiata.
pauska,

1
Il bus PCIe continuerà. Il RAID software (se ne HO BISOGNO ) sarà basato su ZFS, quindi è capace. Per ora ho ordinato due carte, ma la letteratura Fusion-io sembra dire "una carta è abbastanza buona".
ewwhite,

Anche ZFS deve utilizzare i cicli della CPU per eseguire il mirroring dei dati, quindi aggiunge complessità e latenza, ma è impossibile dire quanto influirebbe sull'applicazione specifica. Fusion sembra essere molto orgoglioso del loro basso costo della CPU sul mirroring / salvaguardia interno ..
pauska,

Risposte:


16

Alla fine, dipende dal tuo modello di fallimento. Qual è l'impatto di un fallimento?

Storicamente, abbiamo sempre effettuato il RAID di tutto poiché il costo per farlo è stato trascurabile. Altri $ 500 per un'unità per il mirroring? Vale totalmente il costo senza nemmeno considerarlo.

Quando si parla di altri $ 10K + per attivare il mirroring, è necessario un po 'più di considerazione.


No, non è necessario il mirroring

Le schede Fusion-io hanno una ridondanza interna abbastanza buona. Questo non è il tipo di hardware in cui il tuo disco è un singolo chip. Nella maggior parte delle situazioni in cui ho riscontrato un errore, si è verificato un problema con il firmware che ha interessato entrambi i membri di un mirror, quindi RAID non avrebbe avuto importanza.

Pensa a una scheda Fusion-io come a un controller RAID con dischi dietro. Stai bene con una configurazione a controller singolo? Probabilmente. Trattalo così.

In molte configurazioni in cui distribuiresti unità Fusion-io, avrai altre protezioni integrate (ridondanza a livello di nodo), quindi non ha molto senso.


Sì, è necessario il mirroring

RAID aumenta la tua disponibilità . Hai bisogno della massima disponibilità assoluta nonostante il costo? Il costo di un guasto e possibili tempi di fermo sono costosi? Vai avanti e rispecchia le unità. In una configurazione statisticamente grande, si avranno guasti alle unità nonostante le protezioni interne.


Aggiornamento: ho rispecchiato le schede Fusion-io nelle installazioni in cui il cliente era d'accordo con la spesa aggiuntiva (e per facilitare me stesso nella distribuzione del prodotto). Ho distribuito diverse installazioni di schede singole in altre situazioni. Finora tutto è andato bene ...
ewwhite

18

La ridondanza sul dispositivo dovrebbe fare il lavoro bene per i guasti dei chip flash - analogo al RAID tra tutti i componenti che eseguono l'archiviazione effettiva dei dati.

Dovrei essere preoccupato per l'errore Fusion-io più di quanto non sarei preoccupato per un errore del controller RAID o un errore della scheda madre?

Un guasto dell'intero dispositivo sarebbe praticamente analogo alla perdita di un controller RAID o di una scheda madre - sarei preoccupato circa la scheda Fusion-io quanto questi altri componenti single-point-of-failure, anche se non Ho esperienza con i dispositivi su larga scala per poter confrontare i tassi di errore utilizzando dati concreti.

Devo eseguire due schede ioDrive2 e unirle con il software RAID (md o ZFS) o non è necessario?

Aggiungere ridondanza in aggiunta a ciò che il dispositivo ha già (diciamo, RAID software tra più schede Fusion-io) sarebbe molto simile a fare RAID software tra due gruppi RAID hardware su due controller RAID diversi; potrebbe essere utile per i sistemi che garantiscono estrema ridondanza per rimuovere un singolo punto di errore aggiuntivo, ma non per le distribuzioni comuni (un RPO di 10 minuti su un mirror dovrebbe essere abbastanza buono per la maggior parte delle applicazioni?).

Amministratori di sistema come RAID. Ciò richiede una mentalità diversa, data la diversa interfaccia e il livello di usura / correzione degli errori disponibili su questo fattore di forma?

Si Credo di si. Stai essenzialmente ottenendo un dispositivo che è come un controller RAID e un mucchio di dispositivi di archiviazione dietro di esso in un unico pacchetto. È sicuramente allettante essere preoccupati di mettere i tuoi dati sensibili su un singolo dispositivo, ma è necessario avere un certo livello di fiducia nella ridondanza interna del dispositivo ... Che dovrebbe essere controbilanciato con una sana comprensione del "RAID non è un concetto di " backup ": essere sempre pronti per il fallimento di un componente ridondante, o per un utente di eliminare i dati su di esso, con buoni backup.


13

Come sai, abbiamo usato il loro kit per un po ', sia in configurazioni RAID che non RAID - Vorrei avere qualche esperienza di fallimento da darti, ma non l'ho fatto. Non abbiamo riscontrato errori che RAID avrebbe aiutato e le loro funzionalità di resilienza a bordo stanno solo migliorando. Anche la funzione principale per cui li usiamo è ora ridimensionata / raggruppata in orizzontale ora, quindi abbiamo ancora meno motivi per RAID. Grandi carte però, li consiglio vivamente.


Un buon punto dati. Tuttavia, non posso dire se l'aggiunta di un livello RAID è eccessiva o meno.
ewwhite,

1
Vedo la tecnologia come non essere il punto di definizione qui - o i tuoi dati hanno bisogno della capacità di supportare la perdita di una singola scheda FusionIO o no - non li pensi solo come dischi veloci, costosi, che non cambiano se tu può vivere senza RAID o non è giusto?
Chopper 3

Leggermente ... Un approccio tradizionale sarebbe quello di utilizzare SSD SAS aziendali in un RAID 1 + 0. Questo è solo applicare lo stesso standard utilizzato per far girare i dischi su SSD. Ma ciò presuppone anche hot-swap. Ciò non si applica a una scheda basata su PCIe, soprattutto quando sarei costretto a utilizzare il software RAID per ottenere questo risultato. Dal momento che Fusion-io ha anche il vantaggio di migliorare il livellamento e il monitoraggio dell'usura, sto cercando di capire le modalità realistiche di guasto coinvolte qui. Tratto Fusion-io come un disco o un controller? Non inseriresti due schede Smart Array in un ProLiant per servire dischi interni, giusto?
ewwhite,

2
@ewwhite Potresti avere due controller RAID con dischi diversi e RAID1 tra i dischi dei controller, se devi essere in grado di gestire il guasto di un controller RAID. Direi di trattare la scheda Fusion-io come un controller RAID in termini di pianificazione della ridondanza.
Shane Madden

@ewwhite Se guardi il testo che ho usato potresti leggere tra le righe che abbiamo avuto un'interruzione su un singolo server dotato di FusionIO - avevamo un mobo go pop - un DL580 G6 (ne abbiamo pochissimi) e qualcosa è successo a un'intera banca di memoria e ha eliminato il consiglio di amministrazione. In questo scenario era RAID 1'ed ma ovviamente non importava. Naturalmente, tieni presente che PCIe può essere hot-swap, può essere un grosso problema ma può funzionare bene.
Chopper 3

9

Non ho familiarità con Fusion direttamente, ma ho qualche esperienza SSD PCIe su cui lavorare.

Quelli con cui lavoro presentano quattro diversi LUN sul sistema operativo e trattano la scheda PCIe come un HBA. Se voglio RAID, farei il mirroring di due LUN insieme usando il sistema operativo. Questo mi consente una soluzione a una scheda per la ridondanza. Tuttavia, se la carta fallisce completamente, sono ancora su un torrente. Non so se ioDrive faccia la stessa cosa.


Questa particolare unità presenterà un dispositivo a blocchi.
ewwhite,

1
ioDrives presenta uno o due dispositivi indipendenti. Se ne presenta due, sono fisicamente due dispositivi separati su una scheda ciascuno con la propria protezione interna. Confronta, per esempio, con l'Intel 910 che presenta quattro dispositivi ciascuno che dovrebbe essere trattato come un SSD.
MikeyB,

5

Ho comprato 6 delle carte da 1.2tb negli ultimi due mesi. Uno di loro ha già fallito. Quindi li farei assolutamente irruzione. Ho usato il mirror del disco attivo di Windows. L'unità non è riuscita con il messaggio "mancante mappa LEB". Mi è stato detto che avrebbe dovuto essere sostituito. Ma per ottenere l'approvazione della RMA avrei bisogno di scattare foto su entrambi i lati della scheda difettosa (che richiede un'interruzione della produzione per estrarre la scheda). E poi mi hanno detto che la carta sostitutiva era esaurita senza eta. Quindi potresti voler pensare molto prima di acquistarli.


Grazie per aver condiviso la tua esperienza. Sono andato avanti e ho distribuito queste schede da 1,2 TB in coppie speculari. Sto utilizzando HP SKU, quindi ho il mio contratto di supporto HP per gestire RMA / sostituzione.
ewwhite,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.