A cosa serve la batteria su un controller RAID con memorizzazione nella cache supportato da batteria se il server si trova su un gruppo di continuità?


10

La batteria è ridondante se il server si trova su un UPS di dimensioni adeguate? C'è un'opzione per forzare la modalità write-back e voglio capire il rischio. Comprendo che aiuta contro interruzioni di corrente mentre i dati nella cache non sono stati scritti sul disco fisico. Ma se il server si trova su un UPS, non vi è alcun rischio di perdita di energia, soprattutto se si tratta di un UPS intelligente e il server è configurato per spegnersi con grazia quando la batteria raggiunge uno stato basso. Mi sto perdendo qualcosa?

Risposte:


22

La tua comprensione è essenzialmente corretta.

Consentire al controller di memorizzare nella cache i dati di scrittura nella sua RAM locale migliora la velocità di scrittura, tuttavia ti espone al rischio che il sistema operativo pensi che i dati siano stati scritti su disco (perché il controller ce l'ha) e che l'alimentazione si interrompa prima che il controller completi quella scrittura . Il backup della batteria consente ai dati nella cache di sopravvivere fino a quando la macchina non viene riaccesa, mitigando tale rischio.

Per quanto riguarda i vantaggi se il sistema è già su un UPS, cosa succede se si supera l'autonomia dell'UPS (possibile anche con un UPS intelligente) o se si interrompono gli alimentatori del server? O se qualcuno strappa accidentalmente i cavi di alimentazione?
Molte cose possono causare un'interruzione di corrente. Un UPS protegge solo da alcuni di essi.


14
Powercords improvvisamente strappati sono un rischio nella maggior parte dei datacenter!
sysadmin1138

1
Bing su tutti i punti. Ne vale la pena il costo di un BBWC, a meno che i dati non siano davvero transitori, è possibile acquisire l'evento e ripristinarlo in altro modo e si desidera solo migliorare le prestazioni forzando la memorizzazione nella cache del write-back.
mfinni,

3
Nessun rischio di perdita di potenza? Oltre alle risposte di voretaq7, aggiungi anche: intervento dell'interruttore automatico, malfunzionamento dell'UPS ... ci sono molte cose che possono andare storte.
MikeyB,

@mikeyB buon punto sugli interruttori - Sono stato in almeno un DC in cui le gambe di potenza A / B occasionalmente sono tornate a un piano o interruttore di pannello
voretaq7

Grazie a tutti per le vostre risposte. @ voretaq7 - il server ha anche più alimentatori, più cavi di alimentazione, UPS e generatori, ma vedo il tuo punto in termini di design della scheda stessa (non sapendo in quale scatola potrebbe finire). @mfinni: è una buona idea, ma avremmo grossi problemi con le migliaia di server che si arrestano tutti in una volta.
RPC,

8

Ci sono due ragioni per la batteria;

  • Che cosa succede se il tuo PSU / s improvvisamente diventa pop - indipendentemente da un UPS il tuo sistema è morto e potresti aver avuto dati non impegnati nella cache, avere la batteria assicura che i dati siano scritti correttamente quando viene ripristinata l'alimentazione. Lo stesso vale se si è verificato un errore della scheda di sistema, ovviamente.
  • Cosa succede se qualcosa è morto sul controller del disco, i cavi o i contenitori del disco? - dire qualcosa bloccato sul cavo e danneggiato il connettore su entrambe le estremità - di nuovo potresti avere dei dati nella tua cache in attesa di essere scritti, ma non c'è modo di farlo perché la scheda, il cavo, il contenitore ecc. sono morti. Potrebbe essere necessario sostituire il controller, se si dispone di cache con batteria di riserva, è possibile spostare quella cache su una nuova scheda senza perdere i dati.

Questi sono entrambi buoni motivi ma, ad essere sinceri, le cache basate su flash sono state sostituite da quelle alimentate a batteria di recente per ovvie ragioni e le consiglierei prima - che ha detto che se fai molto scrivere raccomanderei l'una o l'altra solo un UPS.


-1

La batteria consente inoltre di migliorare le prestazioni e gli scopi indicati da voretaq7. Rimuovere la batteria e il dispositivo continuerà a funzionare ma a velocità sostanzialmente ridotta.


3
Questo non è specificamente corretto in questo caso. @RPC afferma esplicitamente che può forzare la memorizzazione nella cache del write-back senza la batteria del controller. La memorizzazione nella cache del write-back è ciò che migliora le prestazioni.
mfinni,

In effetti sono sicuro che può, ma la batteria migliora sostanzialmente le prestazioni. Ho lavorato alla risoluzione dei problemi di prestazioni degradate su una coppia di dispositivi di archiviazione HP MSA 20 e il degrado è stato causato da una batteria con cache write-back non funzionante. La batteria è stata sostituita e le prestazioni sono aumentate.
Mitch,

2
Si, lo so. Perché su quelle macchine, la presenza della batteria consente di scrivere nella cache. Quando la batteria si guasta, la memorizzazione nella cache si interrompe e le prestazioni diminuiscono. Quando la batteria è fissa, la memorizzazione nella cache inizia di nuovo e le prestazioni migliorano. Il suo controller gli consente di forzare la memorizzazione nella cache del write-back, che è ciò che migliora le prestazioni , senza la batteria.
mfinni,

Mitch è una preoccupazione molto specifica, conosco molto bene i controller HP E / P / i e per quelle schede hai ragione perché HP rende molto difficile abilitare la cache senza batteria - ma questa domanda non è limitata a quelle carte e ce ne sono molti che ti consentono di abilitare la cache senza batteria o infatti farlo di default - quindi la preoccupazione di mfinni.
Chopper3,

-1

Se hai un UPS puoi forzare la cache e non usare la pastella durante il raid. Se perdi energia senza una carta raid puoi ottenere dati corrotti, ecco a cosa servono i backup.

E solo perché hai perso energia non significa che il tuo sistema è brindisi. La cache contiene solo 256 mega e viene scaricata / scritta su HD per tutto il tempo quando è inattiva. Non è come se contenesse tutti i dati e non li lascia mai andare. Viene sempre arrossato.

Una meteora potrebbe colpire l'edificio e far esplodere tutto, non lasciare che questo mosto ti abbassi. Ho eseguito il raid 1 con cache attiva e nessuna batteria senza problemi.

Puoi diventare davvero anale in questa conversazione. Perché non avere 4x fall over server, 10x backup ecc. Ecc. Non è un grosso problema.

Attiva la cache utilizzando l'UPS. Se hai un colpo ps puoi recuperare i dati e dovrebbe soffiare durante le ore di lavoro con qualcuno che utilizza il computer e avere l'applicazione giusta aperta e salvare i dati allo stesso tempo ecc. Ecc. Quindi le probabilità sono basse e se succede che può essere riparato facilmente.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.