Smartd sta davvero segnalando che questa unità è troppo calda?


9

"Attributo di utilizzo SMART: 194 Temperature_Celsius modificato da 146 a 150". Questo è su CentOS 6.6.

Cosa significa veramente? L'unità è davvero calda o è forse un bug del software? L'unità è un'unità eSATA da 2 TB e risulta piacevole al tatto e il server situato in un seminterrato è 70F.

# smartctl -A /dev/sdb
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-504.16.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   134   134   054    Pre-fail  Offline      -       89
  3 Spin_Up_Time            0x0007   123   123   024    Pre-fail  Always       -       507 (Average 505)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       89
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   135   135   020    Pre-fail  Offline      -       26
  9 Power_On_Hours          0x0012   096   096   000    Old_age   Always       -       29541
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       71
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       205
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       205
**194 Temperature_Celsius     0x0002   150   150   000    Old_age   Always       -       40 (Min/Max 20/49)**
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       9

Risposte:


13

Questo è solo il valore dell'attributo SMART. Non è la temperatura in nessuna unità normale. (è più simile a un numero compreso tra 255 (veramente molto freddo) e 0 (davvero molto caldo), a seconda dell'unità che è caldo e cosa no)

Se vuoi vedere la temperatura del tuo disco usa smartctl -A /dev/sdx

Otterrai un tavolo come questo:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
194 Temperature_Celsius     0x0022   107   097   000    Old_age   Always       -       45

RAW_VALUE è quello che stai cercando ... (il mio disco è abbastanza caldo a 45 ° C)

VALUEè il valore dell'attributo e quando scende al di sotto THRESH, l'unità si prepara a chiedere la sostituzione. (Non tutti gli attributi hanno soglia, proprio come la mia temperatura)

Per quanto riguarda ciò che è caldo e ciò che non lo è, dipende davvero dall'unità. C'è un documento un po 'datato di Google sui tassi di guasto delle unità, in cui si afferma che le unità a circa 40 ° C hanno i tassi di guasti più bassi (almeno per Google e nel 2007). Ricordo di aver letto un altro documento (non riesco a trovarlo ora) che affermava che l'alta temperatura non è un problema per il disco rigido. Cambiamenti di temperatura improvvisi e frequenti possono causare il guasto del disco prima. Quindi, fintanto che la temperatura dell'unità è abbastanza stabile (puoi monitorarlo usando qualcosa come Munin ), dovresti andare bene.

smartdsegnala eventuali cambiamenti negli attributi. Non significa che c'è qualcosa che non va.


1
Grazie. Vedi sopra, ho aggiornato questo con l'output smartctl. RAW_VALUE è 40. Questo è 40 gradi Celsius, che è 104F. È considerato caldo? O sta diventando caldo e lo sta registrando perché potrebbe essere una tendenza pericolosa? Ma il Min / Max è 20/49, in modo che non suona come è troppo caldo, almeno ancora,
Edward_178118

1
@ Edward_178118 ha aggiornato la risposta, spero che sia d'aiuto.
Fox,

Quindi i valori di soglia di 150 non avevano nulla a che fare con l'essere 150C?
Edward_178118,

Esattamente. 150 sarebbe troppo caldo. Anche troppo caldo per una CPU, che ottiene il dissipatore di calore, per rimanere sotto gli 80 o giù di lì.
Fox,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.