Sto pensando di utilizzare un'impostazione RAID0 per uno dei nostri cluster di SQL Server. Descriverò la situazione e cerco perché questa potrebbe essere una cattiva idea. Anche se qualcuno che hai casi d'uso, white paper o altra documentazione su cui puoi indicarmi su questo argomento, sarebbe fantastico.
Abbiamo 3 server in 2 datacenter che fanno parte di un cluster SQL. Stanno tutti eseguendo SQL Server in un gruppo di disponibilità. Il primario ha una replica proprio accanto ad essa e un'altra nell'altro datacenter. Stanno eseguendo la replica sincrona con failover automatico. Tutte le unità sono SSD di classe enterprise. Eseguiranno SQL Server 2017 o 2019.
Sto pensando che ci sarebbero molti vantaggi nell'eseguirli su array RAID0 rispetto ad altri metodi con pochi, se del caso, reali inconvenienti. L'unico aspetto negativo che sto vedendo attualmente è la mancanza di ridondanza sul server primario, quindi i guasti non aumentano. Come professionisti:
Se un'unità si guasta, invece di funzionare in uno stato rallentato e degradato fino a quando qualcuno riceve una notifica e agisce manualmente su di essa, il server fallirà immediatamente su un secondario mantenendo la piena funzionalità operativa. Ciò avrà un ulteriore vantaggio nel notificarci un failover, in modo che possiamo indagare prima sulla causa.
Riduce la possibilità di guasto complessivo per capacità TB. Poiché non abbiamo bisogno di unità di parità o mirror, riduciamo il numero di unità per array. Con un numero inferiore di unità, le possibilità totali di guasto dell'unità sono inferiori.
È più economico. La necessità di un numero inferiore di unità per la capacità richiesta costa ovviamente meno.
So che questo non è il pensiero aziendale convenzionale, ma c'è qualcosa che non sto prendendo in considerazione? Mi piacerebbe qualsiasi input sia pro che contro.
Non sto cercando di farlo per ottenere miglioramenti delle prestazioni della query, anche se se ci sono quelli significativi sentiti libero di indicarli. La mia preoccupazione principale è non riuscire a considerare o affrontare un problema di affidabilità o ridondanza a cui non avevo pensato.
Il sistema operativo si trova su un'unità con mirroring separata, quindi il server stesso dovrebbe rimanere attivo. Una di queste unità può essere sostituita e nuovamente replicata. È piccolo e non ci sono file di database diversi dai DB di sistema. Non riesco a immaginarlo impiegando più di minuti. Se uno degli array di dati fallisce, sostituiamo l'unità, ricostruiamo l'array, ripristiniamo e risincronizziamo con AG. Nella mia esperienza personale, il ripristino è stato MOLTO più veloce di una ricostruzione di unità RAID5. Non ho mai avuto un errore RAID1, quindi non so se quella ricostruzione sarebbe più veloce o meno. I ripristini provengono da un backup e vengono portati avanti in modo da corrispondere al primario, quindi l'aumento del carico sul server primario dovrebbe essere minimo, sincronizzando solo gli ultimi minuti dei registri con la replica recuperata.