Significato SSD Samsung "Wear_Leveling_Count"


26

Ho SSD Samsung sul mio laptop e su alcuni server.

Quando io faccio:

smartctl -a /dev/sda | grep 177

Ottengo risultati che non riesco a capire. Ecco alcuni esempi:

# my laptop Samsung SSD 850 EVO 500GB (new)
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
177 Wear_Leveling_Count     0x0013   100   100   000    Pre-fail  Always       -       0

# server 256 GB, SAMSUNG MZ7TE256HMHP-00000
177 Wear_Leveling_Count     0x0013   095   095   000    Pre-fail  Always       -       95

# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (1 year old)
177 Wear_Leveling_Count     0x0013   099   099   000    Pre-fail  Always       -       99

# server 512 GB, SAMSUNG MZ7TE512HMHP-00000 (suppose to be new)
177 Wear_Leveling_Count     0x0013   099   099   000    Pre-fail  Always       -       99

# server 480 GB, SAMSUNG MZ7KM480HAHP-0E005
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       3

# server 240 GB, SAMSUNG MZ7KM240HAGR-0E005
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       11

Qualche idea su come leggere Wear_Leveling_Count?

Alcuni valori sono al minimo, altri al massimo.

Se consideri "laptop" Samsung SSD 850 EVO 500GB, è 0 e probabilmente andrà a 100, quindi fallirà.

Se si considera il primo "server" 256 GB, SAMSUNG MZ7TE256HMHP-00000, è già al massimo? Scenderà a zero?

Risposte:


43

Kingston descrive questo attributo SMART come segue:

Numero di cicli di cancellazione / programma per blocco in media. Questo attributo vuole essere un indicatore dell'usura imminente. Equazione normalizzata: 100 - (100 * Numero medio di cancellazione / Numero massimo di NAND di cicli di cancellazione)

Ignora Raw Datain questi casi (possono essere manipolati dai produttori per funzionare in diversi modi) e guarda la Current Valuecolonna.

Questa fonte di Anandtech ci dà una buona indicazione su come usare questa figura:

Il valore SMART di Wear Leveling Count (WLC) ci fornisce tutti i dati di cui abbiamo bisogno. Il valore corrente rappresenta la resistenza residua dell'unità in percentuale, il che significa che inizia da 100 e diminuisce linearmente durante la scrittura dell'unità. Il valore WLC non elaborato conta i cicli P / E consumati, quindi se questi due valori vengono monitorati durante la scrittura sull'unità, prima o poi troveremo il punto in cui il valore normalizzato diminuisce di uno.

Tutte le unità sono tra il 95 e il 100, e alla fine scenderà a 0. Questa è una stima di quanti write, erase, rewriteecc cicli ogni blocco può passare attraverso prima di fallire, e al momento, una delle unità è stimato a ha utilizzato il 5% della sua durata prevista. Ancora una volta, la parola chiave qui è stimata.

Si noti inoltre che le unità possono utilizzare una tecnologia NAND diversa, quindi le differenze nella vita percepita. Alcune tecnologie NAND prevedono che i blocchi durino circa 1000 cicli PE ciascuno, mentre altri possono essere classificati per un massimo di 30.000.


Ho allegato la tabella "header". Qual è il valore "attuale"? è la colonna "VALUE"?
Nick,

@ Nick Sì, esattamente.
Jonno,

Questo è l'esatto contrario della mia esperienza. Le mie nuove unità (Samsung 850 Pro, Samsung 840 Pro) erano iniziate a un valore grezzo di 0 e sono aumentate da lì. In effetti il ​​mio attuale 840 Pro era a 97 circa un mese fa, ed è ora a 99. (Questo è dal guardare i dati SMART attraverso il software Samsung Magician.)
Granger

3
@Granger Hai una colonna "Valore" o "Attuale"? I valori grezzi in genere spettano all'OEM per decidere cosa fare e non sono necessariamente dati leggibili. Notare nell'esempio l'OP fornito, "VALUE" è 100 e "RAW_VALUE" è 0 per i loro 850 EVO.
Jonno

Ah. Ciò ha più senso se ignoro completamente la colonna "Valore non elaborato".
Granger

2

SMART riporta una condizione PREFAILED per il mio Samsung SM951 (AHCI) da 128 GB, riportata in Linux come SAMSUNG MZHPV128HDGM-00000 (BXW2500Q).

Ma nel mio caso penso che sia un bug del firmware dell'unità,

  • perché la total-bytes-writtenproprietà viene segnalata come 1,1 TB mentre l'unità ha un Total Bytes Written (TBW) specificato di 75 TB! Che probabilmente è sul lato (molto) di salvataggio, perché unità simili (MLC NAND) hanno raggiunto tutte una moltitudine di quelle (600 TB) in un vero test di resistenza ,
  • e, a parte l' wear_level_countavvertimento, non vengono segnalati altri errori o avvertimenti di prefail o oldage,
  • mentre il reallocated-sector-count, che secondo quel test è un buon indicatore pre-fail, è ancora 0.

Quindi il mio consiglio sarebbe di esaminare quei valori per il tuo disco / sistema e basare le tue conclusioni su questo.

Preferisco l'utilità di basso livello skdumpfornita con libatasmartla stessa libreria utilizzata da Gnome Disks .

Utilizzare il seguente comando, sostituendolo /dev/sdccon il percorso del dispositivo a blocchi:

sudo skdump /dev/sdc

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.