Metodo rapido per determinare lo stato dell'unità SSD?

13

Ho un'unità Intel X-25M che è stata contrassegnata due volte "non riuscita" in un array di archiviazione ZFS, come indicato qui . Tuttavia, dopo aver rimosso l'unità, sembra montare, leggere e scrivere su altri computer (Mac, PC, enclosure USB, ecc.)

C'è un buon modo per determinare lo stato attuale dell'unità? Ritengo che il precedente errore nella soluzione ZFS fosse la convergenza di bug, errori nella segnalazione di errori e hardware. Sembra che questa unità possa avere un po 'di vita, però.

— ewwhite
fonte

è un g1 o un g2?

— Jim B,

Questa è un'unità G2 X25-M da 120 GB.

— ewwhite,

12

Un metodo valido, ma non infallibile, per verificare lo stato di qualsiasi unità è quello di verificare gli attributi SMART.

Sotto è l'attributo impostato SMART per un disco Intel X25-M G2 160GB, prelevato utilizzando smartctl v5.41. (La versione è importante, le versioni precedenti di smartctl avevano mappature di nomi di attributi diversi e in realtà non comprendevano correttamente la tabella specifica per questa unità).

# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED     RAW_VALUE
  3 Spin_Up_Time            0x0020   100   100   000    Old_age   Offline      -       0
  4 Start_Stop_Count        0x0030   100   100   000    Old_age   Offline      -       0
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       1
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       4076
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       67
192 Unsafe_Shutdown_Count   0x0032   100   100   000    Old_age   Always       -       30
225 Host_Writes_32MiB       0x0030   200   200   000    Old_age   Offline      -       148418
226 Workld_Media_Wear_Indic 0x0032   100   100   000    Old_age   Always       -       755
227 Workld_Host_Reads_Perc  0x0032   100   100   000    Old_age   Always       -       49
228 Workload_Minutes        0x0032   100   100   000    Old_age   Always       -       16956537
232 Available_Reservd_Space 0x0033   099   099   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   098   098   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0

Ciò dimostra che l'unità ha avuto 1 settore riallocato, ha utilizzato l'1% dello spazio riservato disponibile (attributo 232) e il 2% dei cicli di programma / cancellazione previsti (attributo 233). Ha scritto 148418 * 32 MiB (attributo 225).

Se l'unità mostra un numero significativo di settori riallocati, può essere motivo di preoccupazione, poiché questo probabilmente indica un chip flash difettoso (allo stesso modo in cui un numero significativo di settori riallocati su un disco rotante indica generalmente errori di superficie ). Anche l'End-to-end è male - ho avuto alcuni dischi X25-M G2 da 160 GB che si guastano con errori di end-to-end (> 1000) di grandi dimensioni. Tuttavia, per questi dischi sono presenti solo due utili attributi della condizione di errore, poiché la maggior parte degli utili attributi SMART per i dischi normali non si applicano agli SSD.

Tuttavia, SMART non è generalmente considerata affidabile al 100%. Lo studio di Google sugli errori del disco ha rilevato che, sebbene esistessero buone correlazioni tra i vari indicatori di allarme precoce SMART e il guasto dell'unità, non era uno strumento utile per prevedere il guasto di ciascuna unità. Per questo motivo generalmente utilizzo SMART come modo per dimostrare che un'unità è difettosa (se vengono visualizzati errori, probabilmente si guasterà presto), piuttosto che dimostrare che un'unità è ancora valida.

— Daniel Lawson
fonte

1

Si noti che lo studio di Google si è concentrato sulle indicazioni pre-fallimento di SMART, che si sono rivelate meno che affidabili. La segnalazione delle condizioni di errore è in qualche modo più accurata.

— Chris S,

2

Sebbene sia realizzato per dischi rigidi "tradizionali", l'utilità "badblocks" potrebbe essere di qualche beneficio poiché intendeva esercitare tutti i settori mappabili sull'unità. Con la prevenzione della frammentazione SSD e i rimappaggi interni non sarà in grado di dirti con certezza che l'unità è buona. Tuttavia, se ti dice che l'unità è guasta, sicuramente eliminerei l'unità come morta.

— bot403
fonte

1

HD Tune (e HD Tune Pro ) sono ottimi strumenti per misurare la salute e le prestazioni del tuo disco SSD. La versione gratuita (HD Tune) ha un set di funzionalità molto limitato, ma l'analisi della salute rientra in questo, quindi sei stato fortunato. La versione Pro ha un periodo di prova di 15 giorni che consiglio vivamente di provare, ti fornirà un'analisi approfondita e approfondita sulle prestazioni del tuo SSD.

— András Szepesházi
fonte