Best practice per 24 Disk Array


9

abbiamo appena migrato per il nostro vecchio storage SAN in fibra su un storwize IBM v3700 con 24 dischi SAS da 600 GB.

Questa memoria è collegata direttamente a due server IBM ESXi 5.5 ciascuno con due controller SAS multipath da 6 Gbps.

Fino ad ora, ho configurato l'archiviazione che ho usato in più gruppi RAID5. Ogni gruppo sarebbe per un server / scopo diverso. Principalmente i gruppi RAID sarebbero OracleDB, archivio Oracle, SQL Server e il resto (file server, posta, ecc.). Le applicazioni più importanti sono Oracle e SQL Server.

La mia prima preoccupazione è la sicurezza e quindi le prestazioni per le nostre applicazioni. Quindi ho deciso di utilizzare RAID6 + pezzi di ricambio.

La mia preoccupazione principale ora è, dal momento che stiamo usando ESXi, dovrei configurare l'intero archivio in un singolo RAID, risparmiando spazio e creando volumi di archivio dati da ESXi per ciascun server, o non è una buona pratica ed è meglio crearne uno separato gruppi RAID hardware?


4
Le persone che stanno votando per chiudere questo: questa non è una domanda basata sull'opinione, è una domanda di buone pratiche. C'è una risposta dal fornitore ed è in argomento su serverfault.
Basilio,

Risposte:


7

Ogni fornitore ha i propri consigli, quindi inizia chiedendo a IBM. In genere, puoi aprire un ticket per chiedere consigli sulla configurazione senza pagare un supporto aggiuntivo. Questo o chiunque te lo abbia venduto.

Cercando su Google per un breve periodo, ho scoperto questo libro rosso . Pagina 212, probabilmente vuoi un raid di base 6, che significa 1 obiettivo di riserva e un drive per array di 12. Ciò significa due raid, uno su 12, uno su 11. Non consiglierei il raid 10, perché perdi metà del tuo capacità. Evita la parità, ma è qualcosa di cui devi preoccuparti solo su memoria interna o di fascia bassa. L'archiviazione nasconderà l'overhead di parità delle sovrascritture casuali dietro la cache. Il mio negozio usa il raid 6 esclusivamente per mezzo petabyte di VMWare 5.5, e va bene.

Dovresti leggere quel libro e capire come fanno mdisk e pool. Volete creare un pool a banda larga su tutti i fusi, una volta che i gruppi di raid sono stati impostati.


4

Disclaimer - Questo è altamente basato sull'opinione pubblica e ha contrassegnato la domanda in quanto tale, ma cercherò di offrire una risposta in quanto ho recentemente configurato quasi la stessa configurazione.

Dubito fortemente che qualsiasi tipo di database funzionerà bene su un array RAID5 o 6. La maggior parte dei fornitori sta scoraggiando attivamente (e anche in alcuni casi vietando) l'uso di livelli RAID non identificati basati sulla parità a causa dei tempi di ricostruzione elevati, il che comporta un rischio maggiore o un URE durante una ricostruzione.

Personalmente lo dividerei in due gruppi distinti: un RAID10 per il tuo carico di IO elevato come database e un RAID50 per il resto dei tuoi dati. Il numero di dischi dedicati per ciascun array dipende dalla quantità di dati che è necessario archiviare.

Ad esempio, per l'array a 24 dischi, è possibile perdere due dischi per i pezzi di ricambio del contenitore e creare quattro intervalli di 2 dischi (quindi 8 dischi in totale) per ottenere un RAID10 logico di circa 2,4 TB. Questo ti lascia con 14 dischi per il tuo RAID50, con 7 dischi per span e circa 7,2 TB di spazio disponibile. Ovviamente puoi destreggiarti tra il numero di span, ma tieni presente che i RAID10 necessitano di multipli di 2.

Per quanto riguarda i datastore, non fa davvero molta differenza se non si utilizzano funzioni fantasiose come Storage vMotion e DRS per mescolare le risorse.

Inoltre, per chiarire il tuo ultimo paragrafo: più, dischi più piccoli sono generalmente preferibili a dischi meno grandi , a causa della quantità di tempo necessaria per ricostruire un disco guasto e del carico posto sugli altri dischi durante la ricostruzione.


Devo essere d'accordo con te e seguire i tuoi consigli per RAID10 per il db. Non sono sicuro che RAID50 sia supportato su v3700 poiché va su RAID10. Questo viene fatto in una configurazione a due fasi dal gestore della memoria?
Teo,

6
La tua bandiera non è corretta: questa è una domanda specifica con una risposta specifica e corretta. C'è un redbook di IBM che contiene le informazioni richieste. Inoltre, il tuo commento sul raid 5 e 6 non è corretto per l'archiviazione aziendale. I tempi di ricostruzione su un raid da 12 GB da 600 GB non sono le ricostruzioni di più settimane che ottieni su 7200 unità da 4 TB. Inoltre, il raid 50 non esiste su questo archivio, usano pool a strisce larghe contenenti estensioni da più gruppi di raid del raid 5, 6 o 10.
Basil

1

Non sceglierei mai un RAID6, o nemmeno 5 per i carichi di lavoro in stile database. Poiché sono basati sulla parità, sono soggetti a un'elevata penalità di scrittura e i tempi di ricostruzione possono essere ENORMI.

RAID 10 offre le migliori prestazioni, è possibile sopravvivere a un errore da ciascun lato dell'array e allocare uno o due hot spare per assicurarsi che l'array ritorni rapidamente in ridondanza in caso di guasto di un'unità.

In termini di divisione e presentazione dello storage ... Di solito seguo uno schema di 1 LUN per gruppo RAID, ogni LUN contiene quindi diversi dischi VM.


3
I tempi di ricostruzione su un disco SAS da 600 GB non sono enormi. Il tuo consiglio è vero per l'archiviazione locale di 7200 RPM, non per l'archiviazione aziendale con un controller di cache di scrittura di grandi dimensioni e mandrini piccoli e veloci. Inoltre, per VMWare 5.5, si consigliano due LUN per archivio dati e, laddove possibile, è necessario utilizzare lo striping largo per consentire a ciascun LUN di accedere alle prestazioni sottostanti di tutti i mandrini, non solo di un singolo array.
Basil

1
In entrambi i casi, il RAID basato sulla parità è lento rispetto allo stripe e al mirror (sia le prestazioni che la ricostruzione) e deve essere utilizzato solo laddove la capacità è la preoccupazione, non IOPS e throughput.
tomstephens89,

4
Il problema con le ricostruzioni RAID 5 è meno il tempo necessario per il completamento, ma piuttosto la quantità di dati che devono essere letti (vale a dire: tutti i dati dei dischi sopravvissuti) senza un singolo errore di lettura irrecuperabile:
Hagen von Eitzen

1
Non sto raccomandando il raid 5, Hagen. Sto raccomandando il raid 6. E Tom, la domanda afferma che hanno 24 dischi SAS da 600 GB. Non una vasta gamma di grandi dischi lenti, né alcun SSD (non importa quanto sia affermata la tecnologia). Questa domanda è molto esplicita e chiara.
Basil

2
Le percentuali di errore irrecuperabili sulle unità aziendali sono in genere cento volte migliori rispetto ai modelli desktop. Quella preoccupazione per le ricostruzioni non è particolarmente significativa.
Sobrique,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.