Qual è lo stato attuale (2016) degli SSD in RAID?


51

Ci sono molte risorse disponibili online che discutono sull'uso delle unità SSD nelle configurazioni RAID - tuttavia queste risalgono perlopiù a qualche anno fa e l'ecosistema SSD è molto rapido - proprio mentre ci aspettiamo il rilascio del prodotto "Optane" di Intel entro la fine dell'anno che cambierà tutto ... di nuovo.

Prefarrò la mia domanda affermando che esiste una differenza qualitativa tra SSD di livello consumer (ad esempio Intel 535) e SSD di tipo datacenter (ad esempio Intel DC S3700).

La mia preoccupazione principale riguarda il TRIMsupporto negli scenari RAID. Per quanto ne sappia, nonostante siano trascorsi più di 6 anni da quando gli SSD sono stati introdotti nei computer di fascia consumer e 4 anni da quando NVMe era disponibile in commercio - i controller RAID moderni non supportano ancora l'emissione di TRIMcomandi agli SSD collegati - ad eccezione dei controller RAID Intel in modalità RAID-0.

Sono sorpreso che il TRIMsupporto non sia presente in modalità RAID-1, dato il modo in cui le unità si rispecchiano, sembra semplice. Ma sto divagando.

Noto che se si desidera la tolleranza agli errori con i dischi (sia HDD che SSD), li useresti in una configurazione RAID - ma poiché gli SSD sarebbero senza TRIM significa che subirebbero l'amplificazione in scrittura che si traduce in ulteriore usura, che a sua volta provocherebbe un guasto prematuro degli SSD - questa è una sfortunata ironia: un sistema progettato per proteggere dai guasti dell'unità potrebbe finire con il risultato diretto.

Così:

  1. È TRIMnecessario il supporto per i moderni SSD (era 2015-2016)?

    1.1. C'è qualche differenza nella necessità di TRIMsupporto tra SSD basati su SATA, SATA-Express e NVMe?

  2. Spesso le unità vengono pubblicizzate come dotate di raccolta dei rifiuti integrata migliorata; ciò evita la necessità di TRIM? Come funziona il processo GC in ambienti RAID?

    1.1. Ad esempio, vedi questo QA del 2010 che descrive un peggioramento delle prestazioni piuttosto scadente a causa di non-TRIMming ( https://superuser.com/questions/188985/how-badly-do-ssds-degrade-without-trim ) - e questo l'articolo del 2015 afferma che l'utilizzo di TRIM è fortemente raccomandato ( http://arstechnica.com/gadgets/2015/04/ask-ars-my-ssd-does-garbage-collection-so-i-dont-need-trim -right / ). Qual è la tua risposta a questi forti argomenti per la necessità di TRIM?

  3. Molti articoli e discussioni degli anni precedenti riguardano SLC vs MLC flash e che SLC è preferibile, a causa della sua durata molto più lunga - tuttavia sembra che tutti gli SSD oggi (indipendentemente da dove si trovino nello spettro Consumer-to-Enterprise) siano MLC oggi - questa distinzione di rilevanza è più?

    1.1 E che dire del flash TLC?

  4. Gli SSD aziendali tendono ad avere limiti di resistenza / scrittura molto più elevati (spesso misurati in quante volte è possibile sovrascrivere completamente l'unità in un giorno, per tutta la durata prevista di 5 anni di un'unità) - se il loro limite del ciclo di scrittura è molto alto (ad es. 100 scritture complete al giorno) significa che non ne hanno affatto bisogno TRIMperché quei limiti sono così alti, oppure - al contrario - questi limiti sono raggiungibili solo usando TRIM?


6
Anche se non posso rispondere alla tua domanda, penso che dovrebbe essere considerato alla luce del fatto che il nostro settore sta cercando di eliminare il RAID proprietario, tutti i provider di cloud pubblici utilizzano tutti gli SSD ora sui servizi di elaborazione e archiviazione, sicuramente hanno risolto questo con software, codici di cancellazione ecc. Le innovazioni del cloud computing hanno esposto cose come l'hardware RAID, Cisco IOS e le reti di archiviazione proprietarie come prodotti inutili che fermentano al vertice della catena alimentare e ostacolano effettivamente l'innovazione. l'hardware RAID non può essere venduto su larga scala (ad AWS, Azure, CERN) quindi ...
Sum1sAdmin

@ Sum1sAdmin tutti i provider di cloud pubblici utilizzano SSD ora sui servizi di elaborazione e archiviazione Stai dicendo che AWS o BlackBlaze memorizzano i dati solo su SSD?
AL

@AL bene no, sto solo sottolineando che l'offerta SSD per blocchi, file, oggetti e memoria
temporanea

Sono completamente in disaccordo con la "differenza qualitativa" tra commerciale e consumatore. Vi posso assicurare che non vi è alcuna differenza nella produzione di NAND. Esistono certamente produttori diversi (Samsung vs Intel) ma nessuno dei due ha un processo di produzione specifico per i consumatori. Esistono certamente differenze di funzionalità, ma non differenze di qualità.
Jim B,

A proposito di Optane, siamo quasi a metà del 2016 e non si vede da nessuna parte ... Qualcuno sa qual è l'accordo?
Jeff Meden,

Risposte:


24

Proviamo a rispondere a una domanda alla volta:

  • Il supporto TRIM è necessario per gli SSD moderni (era 2015-2016)?

Risposta breve: nella maggior parte dei casi, no. Risposta lunga: se si riserva uno spazio di riserva sufficiente (~ 20%), anche le unità consumer di solito hanno valori di coerenza delle prestazioni abbastanza buoni (ma è necessario evitare le unità che, invece, si strozzano con le scritture sostenute). Le unità di livello enterprise sono ancora migliori, sia perché hanno uno spazio di riserva maggiore per impostazione predefinita sia perché la combinazione di controller / firmware è ottimizzata per l'uso continuo dell'unità. Ad esempio, dai un'occhiata all'unità S3700 a cui hai fatto riferimento: anche senza tagliare, ha un'ottima consistenza in scrittura.

  • Spesso le unità pubblicizzate hanno una raccolta dei rifiuti integrata migliorata, ciò evita la necessità di TRIM? Come funziona il processo GC in ambienti RAID

Il garbage collector dell'unità fa la sua magia all'interno del sandbox dell'unità - non sa nulla dell'ambiente esterno. Ciò significa che non è (principalmente) influenzato dal livello RAID dell'array. Detto questo, alcuni livelli RAID (quello basato sulla parità, in pratica) a volte (e in alcune specifiche implementazioni) possono aumentare il fattore di amplificazione in scrittura, quindi questo a sua volta significa un lavoro più elevato per le routine GC.

  • Molti articoli e discussioni degli anni precedenti riguardano SLC vs MLC flash e che SLC è preferibile, a causa della sua durata molto più lunga, tuttavia sembra che tutti gli SSD (indipendentemente da dove si trovino nello spettro Consumer-to-Enterprise) siano MLC oggi - è più questa distinzione di rilevanza

Le unità SLC sono sostanzialmente scomparse dall'azienda, essendo relegate principalmente in compiti militari e industriali. L'impresa contrassegnata è ora divisa in tre gradi:

  • Il flash HMLC / MLCe è quello con i chip MLC meglio integrati e certificato per sostenere almeno 25000/30000 cicli di riscrittura;
  • I chip MLC 3D sono valutati a circa 5000-10000 cicli di riscrittura;
  • i normali chip MLC planari e 3D TLC sono valutati a circa 3000 cicli di riscrittura.

In realtà, uno qualsiasi dei tipi di flash di cui sopra dovrebbe fornire una grande capacità di scrittura totale e, in effetti, è possibile trovare unità aziendali con tutti i tipi di flash di cui sopra.

La vera differenziazione tra drive enterprise e consumer sono:

  • la combinazione controller / firmware, con le unità enterprise molto più difficili da morire a causa di un bug del controller imprevisto;
  • la cache di scrittura protetta dall'energia, estremamente importante per prevenire la corruzione del Flash Translation Layer (FTL), che è memorizzato sul flash stesso.

I driver di livello enterprise sono migliori principalmente grazie ai loro controller e condensatori di potenza, piuttosto che a un flash migliore.

  • Gli SSD aziendali tendono ad avere limiti di resistenza / scrittura molto più elevati (spesso misurati in quante volte è possibile sovrascrivere completamente l'unità in un giorno, durante la durata prevista di 5 anni di un'unità), questo evita qualsiasi preoccupazione sull'amplificazione in scrittura causata da non esegue TRIM?

Come detto sopra, le unità di livello enterprise hanno uno spazio di riserva predefinito molto più elevato (~ 20%) che, a sua volta, riduce drasticamente la necessità di TRIM regolari

Comunque, come nota a margine, ti preghiamo di considerare alcuni RAID software che supportano i TRIM (qualcuno ha detto Linux MDRAID? )


Solo 35000 cicli di scrittura ?! Non sembrano molti. Immagino abbia senso se le sostituzioni di unità aumentate sono più economiche rispetto all'acquisto della stessa capacità in SLC.
user253751,

~ 30000 cicli di riscrittura minimi garantiti non sono niente male: con la maggiore capacità portata dallo switch alla NAND a 2 bit per cella, le unità MLC sono molto più economiche di quelle SLC pur mantenendo un livello di resistenza simile. Inoltre, i giorni in cui le celle SLC di classe da 50 nm sono state valutate a> 100000 cicli di riscrittura sono probabilmente passati: anche le unità aziendali hanno flash di classe 34 / 25nm (o inferiore), con resistenza intrinsecamente inferiore (che influisce anche sulle unità SLC).
shodanshok,

@shodanshok La tua conclusione è "Usa SSD di livello enterprise (SAS) collegati a un normale controller RAID e non ti preoccupare" - e che non vedrò un calo delle prestazioni nei 5 anni in cui un disco è garantito? E che i problemi di prestazioni documentati da altri utenti riguardano solo le unità di livello consumer?
Dai,

@Dai per unità "di livello enterprise" Non intendo solo SSD SAS, ma anche SSD SATA selezionati possono essere considerati "di livello enterprise". E sì, le unità aziendali hanno un'ottima coerenza delle prestazioni, anche in condizioni stabili (cioè: completamente piene). Per un esempio di tali unità, vedere qui . Anche alcuni impulsi dei consumatori, se abbinati a una generosa overprovision, possono essere abbastanza coerenti. Vedi qui per un esempio.
shodanshok,

1
Il binning è il processo attraverso i chip di silicio che vengono esaminati e raggruppati in base alla loro qualità. Quindi, i chip NAND MLC aziendali sono sostanzialmente i chip "meglio realizzati" e meglio testati.
shodanshok,

9

Il TRIM non è qualcosa di cui mi preoccupo mai quando uso SSD su moderni controller RAID. Gli SSD sono stati migliorati, le funzionalità del controller RAID hardware sono state ottimizzate per questi carichi di lavoro e il reporting di resistenza è di solito attivo.

TRIM è per unità SATA di fascia bassa. Per gli SSD SAS, abbiamo unmap SCSI, e forse questo è il motivo per cui non incontro le esigenze di TRIM ...

Ma l'altro commentatore è corretto. Software-Defined Storage (SDS) sta cambiando il modo in cui utilizziamo gli SSD. Nelle soluzioni SDS, i controller RAID sono irrilevanti. E cose come TRIM tendono ad essere meno importanti perché gli SSD stanno occupando ruoli specifici. Penso alla memoria di lettura di Nimble o alla ZFS L2ARC e ZIL ... Tutti soddisfano esigenze specifiche e il software sta sfruttando le risorse in modo più intelligente.


3
UNMAP e TRIM fanno esattamente la stessa cosa.
Michael Hampton

2
È sempre necessario tagliare / annullare la mappatura - senza di essa, dovresti fare completamente affidamento sulla raccolta dei rifiuti interna
Jim B,

La garbage collection interna non sostituisce TRIM. Non esiste una funzione firmware in grado di sostituire ciò che fa TRIM. È un po 'allarmante così tante risposte qui non capiscono cosa fa effettivamente TRIM e perché è necessario. Fare riferimento ad articoli come questo arstechnica.com/gadgets/2015/04/…
Shiv

1

Livelli RAID con SSD Una risposta sopra suggerisce che i livelli RAID con parità, come RAID 5, aumentano l'amplificazione della scrittura. Esiste davvero più di un modo per interpretarlo: l'impatto su un'unità o l'impatto sul set di unità.

Rispetto alla ridondanza, RAID 5 aggiunge scritture al set in quanto aggiunge la parità di checksum. Rispetto a un array RAID 0 di (n-1) unità, l'impatto per array di RAID 5 con n unità non è nulla. Ognuna delle n unità riceve altrettante scritture. RAID 5 aggiunge 1 / (n-1) scritture extra al set. RAID 1 e RAID 10, tuttavia, aggiungono al set scritture extra del 100%, poiché tutto ciò che è scritto su un SSD è scritto sul suo mirror.

Pertanto, in termini di scrittura su un set RAID 5 rispetto a un set RAID 10 con lo stesso numero di unità, gli SSD nel set RAID 5 riceveranno meno scritture. E questo rimane vero anche se si aumenta il numero di SSD nel set RAID 10 per equalizzare la capacità utilizzabile.


0

shodanshok ha toccato la vera risposta qui. Se riservi spazio extra, "over-provisioning", la resistenza del tuo SSD e la coerenza delle prestazioni di scrittura saranno entrambe migliorate nel tempo e la mancanza di supporto TRIM diventa per lo più irrilevante. Riservare quello spazio extra può essere fatto semplicemente come, a partire da un nuovo SSD, partizionando meno della piena capacità. La maggior parte dei controller in-drive non trattano mai lo spazio utilizzato allo stesso modo dello spazio riservato e quindi riducono significativamente l'amplificazione in scrittura. Per l'avvio e il sistema operativo, lo spazio riservato al 10% è probabilmente sufficiente. Per le unità che vengono riscritte spesso, aumentare quello spazio.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.