Quanto è efficace il tiering dello storage SSD LSI CacheCade?


22

LSI offre la tecnologia di tiering dello storage CacheCade , che consente ai dispositivi SSD di essere utilizzati come cache di lettura e scrittura per potenziare gli array RAID tradizionali.

Altri venditori hanno adottato tecnologie simili; I controller HP SmartArray hanno la loro SmartCache . Adaptec ha MaxCache ... Per non parlare di una serie di strumenti di accelerazione basati su software ( sTec EnhanceIO , Velobit , FusionIO ioTurbine , Intel CAS , Facebook flashcache ?) .

Proveniente da uno sfondo ZFS , utilizzo diversi tipi di SSD per gestire le funzioni di lettura cache (L2ARC) e scrittura cache (ZIL). Sono necessari tratti diversi per i rispettivi carichi di lavoro; Bassa latenza e resistenza per la memorizzazione nella cache di scrittura. Alta capacità di lettura.

  • Poiché gli SSD CacheCade possono essere utilizzati per la cache di scrittura e lettura, a che scopo gioca la NVRAM integrata del controller RAID?
  • Se utilizzato come cache di scrittura, quale pericolo esiste per gli SSD CacheCade in termini di resistenza alla scrittura? L'uso di SSD consumer sembra essere incoraggiato.
  • Le scritture vanno direttamente su SSD o colpiscono prima la cache del controller?
  • Quanto è intelligente l'algoritmo di memorizzazione nella cache di lettura? Capisco come funzionano ZFS ARC e L2ARC . C'è qualche idea sul processo di tiering CacheCade?
  • Quali metriche esistono per monitorare l'efficacia dell'installazione di CacheCade? Esiste un metodo per osservare una percentuale di riscontri nella cache o una percentuale ? Come fai a sapere se funziona davvero?

Sono interessato a opinioni e feedback sulla soluzione LSI. Qualche avvertimento? Suggerimenti?


2
Adaptec ha lo stesso. Ottima domanda.
TomTom

Risposte:


9

Poiché gli SSD CacheCade possono essere utilizzati per la cache di scrittura e lettura, a che scopo gioca la NVRAM integrata del controller RAID?

Se si lascia abilitata la funzione di memorizzazione nella cache di scrittura del controller, la NVRAM verrà comunque utilizzata principalmente. La cache di scrittura SSD viene in genere utilizzata solo per grandi quantità di dati di scrittura, dove la sola NVRAM non è sufficiente per tenere il passo.

Se utilizzato come cache di scrittura, quale pericolo esiste per gli SSD CacheCade in termini di resistenza alla scrittura? L'uso di SSD consumer sembra essere incoraggiato.

Questo dipende dalla frequenza con cui le tue scritture stanno effettivamente rendendo necessaria la cache di scrittura SSD ... se le tue unità sono in grado di gestire il carico di scrittura abbastanza velocemente da non riempire la NVRAM. Nella maggior parte degli scenari che ho visto, la cache di scrittura ottiene poca o nessuna azione per la maggior parte del tempo, quindi non mi aspetto che ciò abbia un grande impatto sulla resistenza in scrittura - la maggior parte delle scritture su SSD probabilmente faranno parte della tua lettura caching.

Le scritture vanno direttamente su SSD o colpiscono prima la cache del controller?

Risposte sopra ... La cache del controller viene colpita per prima, la cache SSD è più di una seconda linea di difesa.

Quanto è intelligente l'algoritmo di memorizzazione nella cache di lettura? Capisco come funzionano ZFS ARC e L2ARC. C'è qualche idea sul processo di tiering CacheCade?

Spiacente ... nessuna conoscenza per contribuire a questo - spero che qualcun altro abbia qualche intuizione?

Quali metriche esistono per monitorare l'efficacia dell'installazione di CacheCade? Esiste un metodo per osservare una percentuale di riscontri nella cache o una percentuale? Come fai a sapere se funziona?

Non sembra che per questo siano disponibili strumenti di monitoraggio come lo sono con altre implementazioni SAN di questo set di funzionalità ... E poiché il disco virtuale CacheCade non viene presentato al sistema operativo, potresti non avere alcun modo per manualmente monitorare l'attività. Questo potrebbe richiedere solo ulteriori test per verificare l'efficacia ...

Opinione / osservazione: in molti casi (se utilizzata correttamente, leggere la cache in modo appropriato per il set di dati di lavoro) questa funzionalità rende le cose FLY. Ma alla fine, può essere incostante.


1
Ehi, volevo solo aggiungere che potrebbero esserci alcune metriche disponibili nel sistema operativo, dalla pagina 220 del manuale, parlando delle opzioni MegaCLI (che possono essere installate in Linux, Windows, Unix, Bsd, ecc.). DiceConvention MegaCli -perfmon -start -interval <val> -aN Description -perfmon: Specifies collection of performance data. The possible parameters are: -start: Starts the performance data collection. -interval: the time interval (in minutes) that you specified for which you want the performance data collection. The default value is 5 minutes
NickW,


Hmmm, non troppo prolisso. Dovrei vedere come appare il formato della raccolta.
ewwhite,

Sarei interessato a vedere quali dati vengono effettivamente raccolti / segnalati da questo se qualcuno lo verifica ...
JimNim

1

Parlando di soluzioni hardware, non ho trovato alcun modo per conoscere l'esatto hit ratio o qualcosa del genere. Credo che ci siano 2 ragioni per questo: il volume dietro il controller appare come una singola unità (e quindi dovrebbe "solo funzionare"), ed è difficile contare "hit" che non saranno per i file ma piuttosto per i settori HDD, quindi potrebbe esserci un certo tasso di hit anche su HDD vuoto che potrebbe creare confusione. Inoltre gli algoritmi alla base dell '"ibridazione" non sono pubblici, quindi conoscere l'itrato non aiuterà molto. Lo compri e lo metti al lavoro: spese ridotte (rispetto alla soluzione SSD pura), buon impatto sulla velocità.

L'approccio "Compralo e usalo" è una buona cosa da considerare, ma il fatto è che nessuno sa con certezza come costruire la combinazione più veloce: dovremmo usare diversi HDD di grandi dimensioni e diversi SSD di cache di grandi dimensioni o dovremmo usare molti HDD di piccole dimensioni e diversi SSD di grandi dimensioni ecc. e qual è la differenza tra 100 o, diciamo, 500 Gb o 2000 Gb di cache SSD (anche 500 sembra eccessivo se i dati caldi del volume sono di piccole dimensioni) e dovrebbe essere come 2x64 Gb o 8x8 Gb per avere il trasferimento dei dati in parallelo. Ancora una volta, ogni fornitore utilizza il proprio algoritmo e può modificarlo al prossimo aggiornamento del firmware.

Scrivo principalmente per dire che i miei risultati mi hanno dato una risposta strana: se usi un server per scopi generici e con profilo di carico generale, allora il controller ibrido h / w va bene anche con SSD relativamente piccoli, ma se i tuoi compiti erano specifico, faresti meglio a scegliere la soluzione s / w (che sarai in grado di scegliere poiché sei l'unico a conoscere il profilo di carico) o per alcuni costosi archivi di schede PCI.


1

Ecco alcuni reclami di Dell:

Prestazioni di archiviazione — I / O al secondo (IOPS):

  • CacheCade ha fornito un aumento di 3 volte più IOPS rispetto alla sola memoria del disco rigido
  • Lo storage SSD SAS ha ottenuto 8 volte più IOPS rispetto allo storage HDD
  • Un'unità Express Flash ha prodotto 10,5 volte più IOPS di 16 HDD

In termini di IOPS, il loro numero sembra essere alla pari. Tendo a conservare i rapporti DiskSpd da vari server e, se ridimensiono uno dei rapporti che ho rispetto al numero di mandrini che ho nel server cache, dovrei ottenere solo 750.000 IOPS. Tuttavia, nel testare questo server stavo superando 2M. È stata davvero l'unica volta in cui ho visto il carico della cpu come fattore dai thread di diskspd iniziare a essere un fattore. Di solito la CPU è ancora minima quando il disco inizia a chiudersi ma questo non è il caso. Mi sto prendendo a calci per non aver eseguito diskspd con e senza ma oh vabbè.

L'altro fattore qui è che è totalmente trasparente ... spendi qualche centinaio di dollari su un SSD di classe enterprise più piccolo, aggiungilo come volume di cache e il gioco è fatto. Se hai soldi da bruciare su tutti gli archivi SSD, allora non importa, ma per respirare la vita in mandrini fisici, ne valgo la pena.


0

L'ho provato su Dell R515 con Dell PERC H700 Raid con 1 GB di memoria con SSD da 500 MB / s

Ho fatto il mio banco segnando poche ore dopo l'installazione e dopo 48 ore

Non ho visto molti miglioramenti per la velocità di scrittura, un piccolo miglioramento per Read, ho fatto il test un bianco fa e non ho numeri ora.

Ma non era significativo e ho finito per usare la scatola di memoria senza questa funzione.

Dalla mia esperienza, la maggior parte di questi software sono solo uno scherzo! se hai bisogno di livelli di archiviazione, creane uno tuo, ottieni hardware affidabile da Dell e riempi la scatola con SSD

Nel mio posto di lavoro, il tiering dello storage funziona davvero bene HP 3Par e il componente aggiuntivo di ottimizzazione adattiva, funziona come pubblicizzato ma questa soluzione è di circa 100K :)


11
Non credo che mettere una cache SSD davanti agli SSD sarebbe di grande aiuto :)
Michael Hampton
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.