Le unità SSD sono affidabili quanto le unità meccaniche (2013)?


162

Le unità SSD sono in circolazione da diversi anni ormai. Ma il problema dell'affidabilità si pone ancora.

Immagino che questo sia il seguito di questa domanda postata 4 anni fa e aggiornata l'ultima volta nel 2011. Ora è il 2013, è molto cambiata? Immagino che sto cercando alcune prove reali, più di un semplice istinto. Forse li stai usando nel tuo DC. Qual è stata la tua esperienza?

Affidabilità delle unità SSD


AGGIORNARE:

È ora il 2016. Penso che la risposta sia probabilmente sì (peccato però che costino ancora di più per GB).

Questo rapporto fornisce alcune prove:

Affidabilità flash nella produzione: l'atteso e l'inaspettato

E alcuni dati interessanti su azionamenti meccanici (di consumo):

Backblaze: dati e statistiche del disco rigido


2
Perché dici che il problema di affidabilità si presenta ancora?
ewwhite

6
L'SSD del laptop di mia moglie smette di funzionare ogni pochi mesi e richiede una strana correzione "accensione ma non provare ad avviare per venti minuti". Quindi va di nuovo bene. Nuova tecnologia, nuovi modi di fallire.
Jaydee,

3
Solo un singolo punto dati, temo: ho ricevuto un MacBook Retina Pro a settembre dell'anno scorso e ho avuto un errore SSD terminale entro 60 giorni. L'unità sostitutiva è andata bene, ma ora sono molto diffidente semplicemente perché la sostituzione / aggiornamento da parte dell'utente non è davvero un'opzione.
Roddy

27
Non vuoi comunque una guida affidabile. Se fallisce alle 14:00 ogni giorno, puoi fare affidamento su di esso per impostare l'orologio. Quello che vuoi è un'unità resiliente.
Alan B,

3
Gli SSD sono in circolazione da molto più tempo di "diversi anni". Più come 40, in realtà, e anche se intendi SSD basati su Flash, parliamo quasi da 20 anni.
alastair,

Risposte:


175

Questa sarà una funzione del tuo carico di lavoro e della classe di unità che acquisti ...

Nelle mie distribuzioni di server, non ho avuto un errore SSD correttamente specificato. Questo avviene attraverso molti diversi tipi di unità, applicazioni e carichi di lavoro.

Ricorda, non tutti gli SSD sono uguali !!

Che cosa significa "correttamente specificato" ?

Se la tua domanda riguarda l'uso di SSD in applicazioni enterprise e server, negli ultimi anni è cambiato un bel po 'rispetto alla domanda originale . Ecco alcune cose da considerare:

  • Identifica il tuo caso d'uso: esistono unità consumer, unità aziendali e persino SSD per applicazioni industriali rinforzate . Non acquistare un disco economico pensato per l'uso desktop ed eseguire un database ad alta intensità di scrittura su di esso.

  • Sono disponibili molti fattori di forma: gli SSD di oggi sono disponibili nelle schede PCIe, SATA e SAS 1.8 ", 2.5", 3.5 "e altre varianti.

  • Usa RAID per i tuoi server: in una situazione del server non dipenderesti da una singola unità meccanica. Perché dovresti fare lo stesso per un SSD?

  • Composizione dell'unità : sono disponibili SSD basati su DRAM, nonché i tipi di flash MLC, eMLC e SLC. Questi ultimi hanno una durata limitata, ma sono ben definiti dal produttore. ad esempio vedrai limiti di scrittura giornalieri come 5 TB / giorno per 3 anni .

  • Le applicazioni dell'unità sono importanti: alcune unità sono per uso generale, mentre altre sono ottimizzate per la lettura o la scrittura. Le unità basate su DRAM come sTec ZeusRAM e DDRDrive non si consumano. Questi sono ideali per ambienti ad alta scrittura e per i dischi più lenti. Le unità MLC tendono ad essere più grandi e ottimizzate per le letture. Le unità SLC hanno una durata migliore rispetto alle unità MLC, ma l'MLC aziendale sembra davvero abbastanza buona per la maggior parte degli scenari.

  • Il TRIM non sembra avere importanza: i controller RAID hardware non sembrano ancora supportarlo completamente . E la maggior parte delle volte che utilizzo SSD, sarà su una configurazione RAID hardware. Non è qualcosa di cui mi sono preoccupato nelle mie installazioni. Forse dovrei?

  • Endurance: l' over-provisioning è comune negli SSD di classe server. A volte questo può essere fatto a livello di firmware o semplicemente partizionando l'unità nel modo giusto. Gli algoritmi di livellamento dell'usura sono migliori anche su tutta la linea. Alcune unità riportano persino statistiche sulla durata e sulla resistenza. Ad esempio, alcuni dei miei SSD aziendali Sandisk con marchio HP vengono visualizzati 98% life remainingdopo due anni di utilizzo.

  • I prezzi sono notevolmente diminuiti: gli SSD hanno raggiunto il giusto prezzo: rapporto prestazioni per molte applicazioni. Quando le prestazioni sono davvero necessarie, è raro che le unità meccaniche siano predefinite.

  • La reputazione è stata consolidata: ad esempio Intel è sicura ma non ad alte prestazioni. OCZ non è affidabile. Le unità basate su Sandforce sono buone. sTec / STEC è estremamente solido ed è l'OEM per molte unità array di fascia alta. Sandisk / Pliant è simile. OWC ha ottime soluzioni SSD con un'eccezionale garanzia per server a basso impatto e per l'implementazione di workstation / laptop.

  • La protezione dalla perdita di potenza è importante: guarda le unità con supercondensatori / supercaps per gestire scritture eccezionali durante gli eventi di alimentazione. Alcune unità aumentano le prestazioni con le cache integrate o le sfruttano per ridurre l'usura. I supercaps assicurano che quelle scritture vengano scaricate in un archivio stabile.

  • Soluzioni ibride: i fornitori di controller RAID hardware offrono la possibilità di aumentare gli array di dischi standard con SSD per accelerare le letture / scritture o fungere da cache intelligente. LSI ha CacheCade e le sue offerte hardware / software Nytro . Esistono anche soluzioni software e di sistema operativo per fare cose come fornire cache locale su sistemi di applicazioni, database o hypervisor. I filesystem avanzati come ZFS fanno un uso molto intelligente di SSD ottimizzati per la lettura e la scrittura; ZFS può essere configurato per utilizzare dispositivi separati per la memorizzazione nella cache secondaria e per il registro degli intenti e gli SSD vengono spesso utilizzati in tale capacità anche per i pool di HDD.

  • Il flash di alto livello è arrivato: soluzioni flash PCIe come FusionIO sono maturate al punto in cui le organizzazioni si sentono a proprio agio nell'implementare applicazioni critiche che si affidano all'aumento delle prestazioni. Le soluzioni SAN e Appliance come RanSan e Violin Memory sono ancora disponibili, con un numero maggiore di partecipanti che entrano in quello spazio.

inserisci qui la descrizione dell'immagine


12
Il TRIM è molto importante nelle unità con un provisioning eccessivo, come nel caso delle unità consumer dove $ / GB è fondamentale. La maggior parte delle unità aziendali ha un provisioning eccessivo sufficiente affinché TRIM non faccia alcuna differenza.
Mr Alpha,

2
@MisterSmith Vedi cosa ho scritto sopra. SSD diversi hanno caratteristiche diverse. Usa lo strumento giusto per il lavoro. Se dovessi prendere un Corsair o un'altra unità di livello consumer e usarlo come SSD per un sistema di database attivo in scrittura pesante o come dispositivo di registro ZIL per un array di archiviazione ZFS, lo brucerei in un mese o due .
ewwhite

1
Post eccellente. Una mia piccola sorpresa: i controller RAID non sono sempre la scelta giusta con gli SSD. I controller RAID sono stati progettati per lo striping dei dati e l'aggiunta di codici di correzione degli errori su più dischi magnetici. I controller SSD eseguono già lo striping nativo dei dati e aggiungono codici di correzione errori su più banchi di NVRAM. Inoltre, l'aggiunta di un controller RAID introduce uno SPOF aggiuntivo, il controller RAID stesso. L'uso di un controller RAID separato è spesso la scelta giusta, ma a volte usare un SSD migliore (SATA / SAS di livello superiore o persino schede PCI-E come Fusion-IO) è una scelta migliore .
Jesper Mortensen,

5
@rickyduck, in realtà in un data center, un guasto di una singola unità è protetto da RAID, e significa spendere qualche prezzo per sostituirlo senza tempi di inattività; mentre in un impianto di gioco, un guasto del singolo disco è la perdita totale di dati e la reinstallazione del sistema operativo.

2
@MisterSmith anche gli SSD desktop di fascia alta sono più economici per GB rispetto a quelli destinati ai tipici data center. Oltre a controller più potenti in alcuni casi (o solo firmware a basso volume ottimizzato per la velocità effettiva anziché le prestazioni di burst), ottengono il miglior flash scartato dalla parte superiore della produzione perché molti carichi di lavoro del server sono ordini di grandezza più intensivi di I / O del desktop unità e ucciderebbe rapidamente un'unità consumer.
Dan Neely,

59

Tutti i laptop al mio lavoro hanno un SSD o ibrido dal 2009. La mia esperienza SSD in sintesi:

  • Quelle che chiamerò unità di "1a generazione", vendute principalmente nel 2009:
    • Nel primo anno morirono circa 1/4, quasi tutti per Sindrome della morte improvvisa (SSD - È divertente, ride). Questo è stato molto evidente per gli utenti finali e fastidioso, ma la drastica differenza di velocità ha reso tollerabile questo modello di guasto costante.
    • Dopo 3 anni tutte le unità sono morte (Sudden Death o Wear-out), tranne due che stanno ancora dando dei calci (attualmente le unità L2Arc in un server).
  • Le unità "2nd Gen", vendute intorno al 2010-11, sono distinte dalla generazione precedente poiché i loro tassi di Sindrome della morte improvvisa sono diminuiti drasticamente. Tuttavia, il "problema" logoro è continuato.
    • Dopo il primo anno la maggior parte delle unità funzionava ancora. Ci furono un paio di morti improvvise. Una coppia non è riuscita a logorarsi.
    • Dopo 2-3 anni ancora poco più della metà lavora ancora. Il tasso di insuccesso del primo anno è sostanzialmente continuato.
  • Le unità "3rd Gen", vendute 2012+, funzionano ancora.
    • Dopo il primo anno tutto funziona ancora (bussare al legno).
    • Il disco più vecchio che ho è del marzo 2012, quindi non ci sono ancora dati di 2-3 anni.

Errore SSD (cumulativo)


Aggiornamento di maggio 2014:
alcune unità "2nd Gen" da allora non sono riuscite, ma circa un terzo delle unità originali funziona ancora. Tutte le unità "3rd Gen" dal grafico sopra funzionano ancora (knock on wood). Ho sentito storie simili da altri, ma portano ancora lo stesso avvertimento sulla morte su ali veloci . Il vigile manterrà il backup dei propri dati.


2
La mia esperienza fa eco a questo. Detto questo, forniamo ancora dischi rigidi USB che i dipendenti possono utilizzare come backup della macchina del tempo (oltre al nostro regime di backup offsite standard), per consentire ripristini rapidi e granulari in caso di guasto o perdita catastrofica.
EEAA

22
Dai alla terza generazione un altro anno o due. ;)
Andy,

7
Vale anche la pena notare che gli SSD hanno molte più probabilità di soffrire di bug del firmware rispetto agli HDD; il firmware è sia più complicato che meno maturo, il che non è una buona combinazione.
alastair,

2
@Andy ha ragione. A partire dal 2009, dici che l'emivita era di circa un anno. Per il 2010-2011 abbiamo appena 3 anni per la metà di quella gamma in questo momento, dove indichi un'emivita di 3 anni. Ciò potrebbe basarsi solo sulle osservazioni attuali. Se l'emivita per le unità 2012 e 2013 sia migliorata oltre i 3 anni non si può davvero sapere almeno fino al 2016. (Potremmo provare a estrapolare dai guasti precoci, ma questi sarebbero probabilmente solo difetti di fabbricazione isolati, non causati da lungo a lungo termine.)
Andrew Vit

1
Dal 2010 utilizzo 2 x Intel X25M 80Gb G1. Il mio lavoro prevede processi di lettura / scrittura pesanti. Ogni pochi mesi azzerare l'unità (non è necessario) per ripristinare le prestazioni, ma per il resto zero problemi. L'anno scorso ho aggiunto un Samsung 230 da 256 Gb. Nessun problema finora!
Antillar Maximus

18

Nella mia esperienza, il vero problema sono i controller morenti, non la memoria flash stessa. Ho installato circa 10 SSD Samsung (830, 840 [non pro]) e nessuno di questi ha fatto problemi finora. L'opposto totale sono le unità con i controller Sandforce, ho avuto diversi problemi con le unità di agilità OCZ, in particolare si blocca a intervalli di tempo irregolari, in cui l'unità smette di funzionare fino allo spegnimento / spegnimento del computer. Posso darti due consigli:

  1. Se hai bisogno di un'alta affidabilità, scegli un'unità con MLC, migliore flash SLC. Samsung 840 fe ha flash TLC e una breve garanzia, penso non senza alcun motivo;)

  2. Scegli un'unità con un controller noto per essere stabile.


Mi ricorda i controller morenti sull'attuale illuminazione a LED. I LED durano a lungo ma i controller non sembrano.
Matt,

1
Chissà, ma forse fa parte dell'obsolescenza pianificata dalle industrie :)
klingt.net

11

www.hardware.fr uno dei maggiori siti di notizie sull'hardware in Francia è partner di www.ldlc.com uno dei maggiori rivenditori online francesi. Hanno accesso alle loro statistiche sui resi e pubblicano rapporti sulla percentuale di guasti (schede madri, alimentatori, RAM, schede grafiche, HDD, SSD, ...) due volte l'anno dal 2009.

Queste sono statistiche di "morte precoce", da 6 mesi a 1 anno di utilizzo. Inoltre, i ritorni diretti al produttore non possono essere conteggiati, ma la maggior parte delle persone ritorna al rivenditore durante il primo anno e non dovrebbe influire sul confronto tra marchi e modelli.

In generale, i tassi di guasto dell'HDD hanno meno variazioni tra marchi e modelli. La regola è una maggiore capacità> più piatti> un tasso di fallimento più elevato, ma nulla di drammatico.

Il tasso di insuccesso dell'SSD è complessivamente più basso, ma alcuni modelli di SSD sono stati davvero pessimi con circa il 50% di ritorni per i famigerati durante il periodo richiesto (2013). Sembra essersi fermato ora che quel famigerato marchio è stato acquistato.

Alcuni marchi SSD stanno "ottimizzando" il loro firmware solo per ottenere risultati un po 'più alti nei benchmark e a volte finisci con blocchi, schermate blu, ... Anche questo sembra essere meno un problema ora rispetto al 2013.

I rapporti sulla percentuale di guasti sono qui:
2010
2011 (1)
2011 (2)
2012 (1)
2012 (2)
2013 (1)
2013 (2)
2014 (1)
2014 (2)
2015 (1)
2015 (2)
2016 (1 )
2016 (2)


Ecco un link a una versione tradotta automaticamente dell'articolo francese translate.googleusercontent.com/…
SDwarfs

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.