Qual è il limite di temperatura sicuro per un disco rigido SATA consumer?


16

sfondo

Il mio sistema desktop personale a casa ha al suo interno 5 unità SATA. Recentemente il mio sistema ha iniziato a fallire in modi strani come il panico casuale del kernel e alla fine l'ho rintracciato in degradi casuali sull'array RAID. A volte potrei fare il boot, altre volte no e così via. Dopo aver inseguito i problemi del software per un po 'sono finalmente andato a tirare le unità e ho scoperto il vero motivo per cui non funzionavano: erano più caldi di un barbecue il 4 luglio! La ventola del case anteriore si era bloccata e la ventola del PS aveva un connettore di alimentazione allentato bloccato nella sua griglia, quindi l'interno del case stava cucinando.

Come presa, ho trovato un fan di casa e ho raffreddato quella ventosa. Funzionava alla grande con tutto bello un brivido. In questo periodo ho imparato come ottenere le letture della temperatura dell'unità da SMART

for i in a b c d e; do
    sudo smartctl --all /dev/sd$i | grep Temperature_Celsius
done

Ora so che con il mio caso aperto un ventilatore di casa che pulisce definitivamente le ragnatele, le unità funzionano a 31-32 °. Un test rapido senza ventilazione per replicare lo stato guasto mostra che le unità hanno raggiunto gli anni '40 piuttosto rapidamente. Non so quanto sia stato grave durante il fallimento effettivo o quanto tempo sia stato così.

Con questo in mente ho sostituito le ventole guaste, ne ho aggiunte altre un paio, ho aggiornato quello anteriore che soffiava sulle unità da 80 mm a 120 mm e l'ho chiuso di nuovo. Con la posizione eretta di nuovo in piedi, la gamma di temperatura è ora generalmente posizionata a 32 ° nella parte inferiore del set e 37 ° nella parte superiore.

La domanda

Che cos'è un intervallo di temperatura di funzionamento generale sicuro per le unità SATA? Il 37 ° dovrebbe essere un problema o il danno dell'unità non è un problema fino a dopo un certo punto?

Anche se le unità sembrano testare bene ora, con che probabilità è probabile che l'esposizione passata al calore le renda ora soggette a guasti?


Una delle cose che ho notato in particolare con le più recenti unità di raffreddamento tecnologiche in esecuzione, diventano MOLTO più calde quando sono in condizioni di utilizzo intenso. Mentre le mie verdure (per esempio) sono praticamente fredde per la maggior parte del tempo che sono lì a guardare / toccare, si riscaldano ancora bene quando lavorano sodo. Stessa cosa con i chip del controller Sata, Suuuure il controller Intel non ha bisogno della grande sincronizzazione passiva che ho aggiunto ad esso, fino a quando non lo provo quando ha effettivamente lavorato sodo. Sto dicendo che i test (quando si guarda) raramente rappresentano la realtà quando le cose sono andate male. Tutto il resto è stato detto, possono facilmente lavorare 50 * C
Psycogeek il

Risposte:


25

37 gradi non dovrebbero essere affatto un problema. Naturalmente, i dischi rigidi differiscono nelle loro specifiche, alcuni possono funzionare più caldi degli altri. Dovresti controllare le specifiche pubblicate delle unità che hai. Ad esempio, la temperatura operativa di 1 TB di WD Caviar Black va da -0 ° C a 60 ° C. Ovviamente, non si desidera che l'unità funzioni a 60 °, poiché potrebbe ridurne la durata.

Google ha pubblicato uno studio molto interessante (PDF) sulla salute e la durata del disco rigido, basato sui dati raccolti dai loro sistemi (molte migliaia di dischi rigidi). Questo studio afferma che:

Complessivamente i nostri esperimenti possono confermare gli effetti di temperatura precedentemente riportati solo per la fascia alta della nostra gamma di temperature e specialmente per i vecchi azionamenti. Negli intervalli di temperatura inferiore e media, temperature più elevate non sono associate a tassi di guasto più elevati. Questo è un risultato abbastanza sorprendente, che potrebbe indicare che i progettisti di datacenter o server hanno più libertà di quanto si pensasse quando si impostano le temperature operative per le apparecchiature che contengono unità disco.

Il loro grafico mostra che il tasso di faulure non aumenta fino a quando la temperatura dell'unità non supera i 45 gradi.


3

Questa è solo una mia esperienza personale limitata, ma ho eseguito alcune unità nella 40C superiore senza problemi per 2-3 anni, poiché stavo usando un enclosure silenzioso (raffreddato da una piccola ventola per evitare di raggiungere i 50C). A queste temperature assumerei una durata più breve e una morte rapida, piuttosto che la corruzione casuale dei dati, ma potrei sbagliarmi. In ogni caso, qualsiasi cosa sotto 40C-42C va bene.

Ma non sottovalutare altri fattori che potrebbero avere un ruolo nella corruzione dei dati:

1) Il ponte sud che ospita il chipset del controller IDE / RAID è spesso raffreddato solo da un piccolo dissipatore di calore. Tendono a surriscaldarsi in condizioni normali, quindi un aumento della temperatura ambiente a causa della mancanza del flusso d'aria del case e di molti HDD potrebbe plausibilmente causare il danneggiamento dei dati.

2) Il surriscaldamento della RAM o della CPU è un colpevole comune di errori di memoria CRC, che si traduce in corruzione dei dati. Il monitoraggio della temperatura della CPU e l'esecuzione di test di memoria sono essenziali di fronte alla corruzione dei dati.

Se i tuoi attuali indicatori SMART vanno bene e non mostrano conteggi settoriali non corretti, considererei le unità sicure per l'uso.


0

Il post iniziale affermava che l'utente non sapeva quanto caldo avesse avuto i suoi dischi - alcuni dischi registrano questo parametro ed è accessibile tramite le informazioni SMART. Sentinal del disco fisso è un pezzo di saftware che riporta questa come temperatura massima per tutta la vita.

Ho visto risultati per unità Maxstor, WD e Seagate

Un paio delle mie unità USB esterne che utilizzo per il backup mostrano rispettivamente temperature massime di 63 e 64 C! Ora ho creato un dispositivo di raffreddamento per l'unità esterna


0

Ho letto il rapporto di cui sopra e ho verificato le gamme di temperatura operative per i dischi rigidi Samsung, WD e Hitachi. Sulla base della ricerca, ho concluso che le unità che operano nei gradi da 30 a 45 gradi offrono il meno probabile rischio di guasto; Un'alta temperatura SMART fino a 55 gradi non è motivo di preoccupazione; e che temperature di sbirciata superiori a 60 gradi indicherebbero una riduzione dell'aspettativa di vita dell'unità.

I miei test indicano che ci si aspetta un aumento fino a 10 gradi durante i periodi di accesso pesante.

Sembra esserci qualche fattore sconosciuto al lavoro che sta causando tassi di guasti anomali nelle unità esterne. Mentre il calore sembra essere parte del problema, non è la risposta completa. Consiglio a tutti gli utenti di unità esterne di monitorare attentamente le temperature ogni volta che si verifica un cambiamento nella natura dell'utilizzo o dell'ambiente delle unità. Questo sembra essere un problema "sconosciuto" (non il solito) che porta all'improvviso surriscaldamento di queste unità.

Attualmente sto rifiutando la spiegazione del virus informatico, l'ignoranza dell'utente, i protocolli USB errati e il posizionamento delle unità in una posizione errata.


2
Benvenuto. Lo scopo di questo sito è di compilare domande e risposte di alta qualità su cui le persone possono fare affidamento per riferimento. Un paio di cose nella tua risposta possono far meravigliare i lettori. Discuti di ricerca e test. Se questo viene pubblicato, sarebbe utile citarlo. L'uso della parola "sconosciuto" solleva una domanda sulle tue qualifiche. Aiuterebbe a descrivere quali fattori noti hai escluso e quali "soliti" problemi causano il surriscaldamento. Descrivi i tuoi test e il numero di unità su cui basare le tue conclusioni in modo che le persone possano capire l'ambito.
fixer1234,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.