Come posso controllare lo stato di un SSD?


81

Sappiamo tutti che gli SSD hanno una durata di vita predeterminata limitata. Quindi la domanda per me è come posso controllare (Ubuntu) Linux quale sia lo stato di salute attuale del mio SSD? E forse una stima quanto tempo ci vorrà?

Lo strumento grafico è preferito, ma anche lo strumento da riga di comando andrebbe bene.

Sto usando Xubuntu 12.04 LTS


1
Puoi aggiungere l'output di smartctl -i /dev/sdaalla tua domanda?
Mitch

1
@ dschinn1001 Non esattamente, si applica solo agli SSD recenti. Gli SSD di prima e seconda generazione hanno una durata limitata in base alla quantità di operazioni di scrittura sul disco.
João André,

1
Provenendo da spinning drive della vecchia scuola, ho usato strumenti per testare l'HD che ha scritto e letto tutto il disco alcune volte, il che ha richiesto alcune ore. Sembra che nessuno degli strumenti menzionati usi un simile approccio? Un tale approccio non ha senso per SSD? Bene, allora sembra che l'SSD registri le proprie esperienze e possa quindi dire se è malato. L'ho capito bene?
Mads Skjern,

@MadsSkjern È perfettamente possibile utilizzare uno strumento come i badblock per verificare lo stato di un SSD. Vi sono tuttavia ottime ragioni per NON farlo. Gli SSD nella mia esperienza in genere falliscono dopo aver superato una certa soglia di scritture, quindi un test di scrittura in lettura distruttiva come quello che può essere eseguito con badblockspuò effettivamente abbreviare la vita dell'unità.
Elder Geek,

Risposte:


35

Installa Gnome Disk Utility e controlla i dati e i test SMART per il conteggio dei livelli di usura o simili. Più alto è quel numero (%, da 1 a 100), più "esaurito" è il tuo SSD, il che significa che hai maggiori probabilità di avere problemi. Ma se hai un SSD recente, non devi preoccuparti.

Installato tramite

 sudo apt-get install gnome-disk-utility

avviarlo via

uno dei menu-> Impostazioni-> Utilità disco

o tramite riga di comando

sudo gnome-disks

2
Sì, non ero sicuro del nome perché l'hanno cambiato in 12.10
João André il

8
palimpsest non è riconosciuto da Ubuntu 14.04, sebbene sia installato gnome-disk-utility. Inoltre non vedo un'utilità del disco nelle impostazioni (icona a forma di ingranaggio). palimpsestè un nome terribile, il nome varia in base alla lingua dell'utente (ad es. inglese vs. qualcos'altro).
Paul,

10
come nota per i lettori; palimpset viene rinominato in gnome-disk (come menzionato askubuntu.com/a/623306/4580 ).
immeëmosol,

2
Perché dici "Se hai un SSD recente, non devi preoccuparti"?
JFA,

2
Lo hai fatto al contrario. Il numero di usura inizia da 100 e diminuisce con l'uso, quindi maggiore è il numero, il MENO utilizzato è l'SSD, vedere qui: superuser.com/questions/1037644/…
Logix

48

per verificare lo stato di un SSD

Per le distribuzioni basate su Ubuntu, Mint o Debian

# apt-get install smartmontools

Media_Wearout_Indicator è ciò che stai cercando. Per 100 significa che il tuo SSD ha una vita del 100%, il numero più basso significa meno vita rimasta.

# smartctl -a /dev/sda | grep Media_Wearout_Indicator

Per mostrare le tue informazioni sdd

# smartctl -a /dev/sda

Puoi leggere l'articolo completo sul blog di Nam Huy Linux - Come controllare la vita di SSD lasciata su Linux


1
Quindi, se il mio ha valore 199 - 199, è credibile?
m4tm4t,

7
Quella proprietà non appare nel mio SSD. Forse dovrei guardare Wear_Leveling_Count invece? come in: sudo smartctl -a / dev / sda | grep Wear_Leveling_Count EDIT: confermato dalla risposta di seguito: askubuntu.com/a/381779/221115
Jose Gómez,

Su Kingston haiWear_Range_Delta
phreakbox il

In KINGSTON SV300S37A240G dovresti cercareSSD_Life_Left
Herlon Aguiar il


35

Se non hai un SSD con marchio Intel: LEGGI QUESTO.

Attento !! - Sono stato fuorviante allegramente da "smartmontools". Ho un SSD Samsung e lo strumento smartmonitor / 'smartctl' ha felicemente riportato erroneamente che l'attributo '233' (hex 'E9') era 'Media_Wearout_Indicator'; infatti - no, per Samsung (e altri produttori) dipende completamente. Questo e altri post sul forum, domande / risposte sullo scambio di stack e blog per utenti esperti che ho trovato sembrano "focalizzati su Intel", con solo vaghi indizi che "può variare". (Contro ogni suggerimento che è necessario fare attenzione alle etichette errate ed errate dell'attributo da parte di smartmontools).

Mentre mi preparavo a copiare il mio SSD su un nuovo hard disk che avevo comprato (a causa di ciò che mi avevano detto gli smartmontools), mi sono avviato a Windows (ho un sistema a doppio avvio), per imparare qualcosa su SSD da ciò che solo Windows Lo strumento Samsung "Samsung_Magician_v43.exe" doveva parlarmi del mio disco: era incredibilmente disinformativo.

Dopo che ore sono state scavate, sono finalmente riuscito a eseguire solo gli strumenti di Windows: hddgaurdian: "code.google.com/p/hddguardian", e poi anche CrystalDiskInfo: Sorpresa! entrambi gli strumenti mi dicono in modo indipendente che il mio SSD Samsung è "perfetto" (hdd guardian dice "5 stelle" e Crystal Disk "98% OK"). Al contrario, lo strumento smartctl ha esplicitamente etichettato l'attributo con 'decimale-233 /' hex-E9 'come "Indicatore di usura dei media" - e mi ha detto che il suo valore era "1" o 1% - un indicatore di (il rischio di) in attesa di fallimento. Per essere il più sicuro possibile, ho scavato e scavato ed è stato finalmente in grado di individuare almeno qualcosa dal funzionario Samsung: " http://www.samsung.com/global/business/semiconductor/minisite/SSD/us/download/ 07_Communicating_With_Your_SSD.pdf"Il documento implica in effetti che l'attributo 'hex E9' / 'decimal' 233 'non viene utilizzato da Samsung allo stesso modo. (Samsung: sono molto deluso, per favore correggi il tuo strumento software ufficiale, o almeno fallo chiaro che non si forniscono informazioni sull'usura usurate!)

Inoltre, se non hai né un SSD Intel né un SSD Samsung, tieni presente che queste informazioni sembrano variare a seconda del produttore. (ad esempio, consultare la tabella delle etichette degli attributi su "code.google.com/p/hddguardian/wiki/about_reliability" per l'unica indicazione utile del grado di variabilità che ho riscontrato.)

Il che cosa: se non si dispone di un SSD Intel, non lasciarsi fuorviare dalle false etichette con nome attributo fornite da smartmonitor. Forse migliorerà in futuro, ma la versione installata di default per Ubuntu 12.04 LTS (aprile 2014) era totalmente fallita. Invece di dirti che "non lo so", smartctl ha etichettato erroneamente l'attributo. Non ho trovato un altro strumento per Linux che rendesse le informazioni "corrette" trasparenti o chiare.


1
Puntelli per l'inclusione del collegamento alla documentazione Samsung dei loro attributi SMART. Non ho idea di quali siano le altre applicazioni che hai citato o di quanto siano utili, ma ti consiglio caldamente di tenere d'occhio l'attributo n. 5 "Conteggio settoriale riallocato" poiché questo sarà un buon indicatore di quanto è vicino il tuo SSD al fallimento, poiché una volta esauriti i settori di riserva che deve utilizzare per sostituire quelli che vanno male, allora ti avvicinerai a EOL sul tuo SSD
Maks

1
Il PDF è ora disponibile all'indirizzo samsung.com/global/business/semiconductor/minisite/SSD/M2M/…
Force

10

Per le unità Kingston su computer basati su Debian

Simile a questa risposta eseguire

# apt-get install smartmontools

Tuttavia, quando eseguo il comando per mostrare le informazioni sull'unità, sembra che SMART sia disabilitato:

# smartctl -a /dev/sda 
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-45-generic] (local build)
[ ... ]
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

È necessario abilitarlo eseguendo quanto segue come root:

# smartctl -s on -a /dev/sda

È quindi possibile eseguire un autotest eseguendo un breve test (che mi ha richiesto circa 1 minuto):

# smartctl -t short -a /dev/sda

o un test più approfondito (che mi ha richiesto circa 1,5 ore):

# smartctl -t long -a /dev/sda

Nota, nella maggior parte dei casi non è necessario smontare l'unità per eseguire questi test. Se lo fai, vedi man smartctl.

Ora, quando esegui smartctl -a /dev/sda, dovresti vedere un risultato del test di autovalutazione. Questo è probabilmente tutto ciò di cui hai veramente bisogno per preoccuparti di:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Se ti piacciono i dettagli, vedrai anche una tabella come questa:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   095   095   050    Old_age   Always       -       0/178007034
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   092   092   000    Old_age   Always       -       7626h+46m+45.580s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       8
171 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       4
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0
189 Airflow_Temperature_Cel 0x0000   030   035   000    Old_age   Offline      -       30 (Min/Max 24/35)
194 Temperature_Celsius     0x0022   030   035   000    Old_age   Always       -       30 (Min/Max 24/35)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/178007034
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/178007034
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/178007034
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       3498
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       2885
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       2885
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       868

Se stai cercando cosa significano tutti questi valori, consulta la documentazione di Kingston .


Se hai intenzione di sottovalutare, almeno lascia un commento ...
Mike

1
Non tutti gli SSD Kingston li supportano tutti. Alcuni che non (come il mio UV400 ) sembrano mostrare numeri casuali in quei campi che non supportano.
otus,

alla risposta mancano alcuni suggerimenti più utili sui dettagli intelligenti. Solo per assicurarsi che il lettore stia leggendo in modo appropriato la tabella di valori risultante. In breve, mi sembra che il valore SSD_Life_Left sia l'indicatore più semplice. Se 100, ssd nuovo di zecca, se 1, un ssd morto che cammina.
mh-cbon,

@ mh-cbon Poiché la risposta è già relativamente prolissa, mi sono semplicemente collegato alla documentazione di Kingston poiché ci sono MOLTI dettagli lì. Tuttavia, se ritieni di poter migliorare la risposta, sentiti libero di modificarla.
Mike,

5

Wear_Leveling_Count è l'attributo giusto da tracciare. Tuttavia, come gli altri attributi, 100 è il valore MIGLIORE e 0 è il PEGGIORE. Pensalo come "percentuale di vita rimanente".


3
Può variare da produttore a produttore, ma molto probabilmente è molto sbagliato. In questa pagina che spiega i codici micron (aka. Cruciali, come in "cruciale m4", ecc.), Questo è "Conteggio medio di cancellazione di tutti i blocchi buoni". Questo è un numero che aumenterà con l'uso. Se fai qualche lettura sul livellamento dell'usura , ti renderai conto che dovrebbe raggiungere almeno le decine di migliaia prima che l'unità si spenga (cioè, probabilmente non vivrai per vederlo morire in questo modo).
Riccioli d'oro

2
Il mio dice 1461.
CMCDragonkai

4

Il modo migliore per verificare lo stato di un SSD è seguire le raccomandazioni del produttore per farlo. Poiché variano da produttore a produttore e possono cambiare nel tempo, è consigliabile verificare con il produttore delle unità in caso di dubbi. Sulla base dei rating MTBF (lo standard JEDEC JESD218A definisce il metodo) fornito dalla maggior parte dei produttori, un SSD dovrebbe durare oltre un milione di ore senza problemi.

Ne ho molti di questi che coprono diversi produttori. Posso garantire che gli attributi SMART variano tra i produttori. A scopo di confronto, ecco un esempio di OCZ e dati intelligenti di un'unità Corsair F40 insieme a una discussione sull'affidabilità di questi dati.

Sebbene i dati SMART possano sicuramente avere valore, poiché alla fine tutti i dispositivi si guastano, l'importante è eseguire regolarmente il backup dei dati. Ciò fornisce la tranquillità che i tuoi dati sono al sicuro mentre aspetti (probabilmente per diversi anni) che il tuo SSD fallisca. Man mano che i costi diminuiscono e le capacità aumentano, è più probabile che si sostituisca un SSD a causa di limiti di spazio piuttosto che guasti. (Nella mia esperienza 10 volte più probabile). Vorrei semplicemente fare il backup regolarmente e non preoccuparmi.

fonti:

Esperienza, http://www.hardcoreware.net/mtbf-ssd-what-does-it-mean-for-you/


0

Per (almeno alcune) unità NVMe, puoi farlo

smartctl -a /dev/nvme0

Puoi quindi cercare una riga come:

Percentage Used:                    5%

Qui i numeri più bassi sono migliori e 100%significa che l'unità è "usurata". La documentazione del produttore suggerisce che è possibile ottenere numeri superiori al 100% se si continua a utilizzare l'unità oltre questo punto ( esempio da Seagate, vedere pagina 12 ).

Nota che se usi lo spazio dei nomi o i dispositivi di partizione, come /dev/nvme0n1o /dev/nvme0n1p1, non funzionerà e otterrai invece un messaggio simile Read NVMe SMART/Health Information failed: NVMe Status 0x4002.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.