Laptop in esecuzione ~ 30 ° più caldo del normale; Secondo quanto riferito, la CPU / il carico sono normali. Cosa potrebbe causare questo e come posso diagnosticarlo?


10

Sto eseguendo l'ultimo Arch Linux sul mio laptop ThinkPad t420 e sto avendo un problema di calore intermittente in cui la mia temperatura salirà dai tipici ~ 45 ° C a ~ 75-90 ° C e rimarrò lì fino al riavvio.

Ho eseguito numerosi strumenti diagnostici, tra l'ovvio htope altri che googling ha suggerito, tra cui powertop, iostats, e sicuramente altri che non ricordo. Finora non ho riscontrato problemi evidenti e apparentemente nessuna differenza nelle letture se la mia macchina funziona normalmente o in questo stato caldo.

Ho anche ucciso i processi più sospetti uno per uno (database e altri demoni), sperando di trovare il colpevole nascosto, senza risultato.

Oltre a questi tentativi, non so da dove iniziare la risoluzione dei problemi . Spero che qualcuno possa indicarmi la giusta direzione per iniziare a cercare il problema più profondo.

Per essere precisi, la mia domanda non è come raffreddare la mia macchina, ma piuttosto cosa potrebbe causare un consistente cambiamento di calore di oltre 30 gradi in un sistema in cui (secondo quanto riferito) CPU e carico sono normali? E quali strumenti / pratiche potrei usare per diagnosticare?

Alcune note che potrebbero essere utili:

  • Io posso raffreddare il sistema (ad esempio disinserendo completamente il controllo della ventola), ma si riscalda subito di nuovo se lasciato solo. Questo sembra suggerire che la ritenzione di calore non è un problema, ma piuttosto qualcosa genera continuamente calore.
  • L'utilizzo e il caricamento della CPU vengono segnalati htopnormalmente dopo l'inserimento di questo stato attivo. Ciò include i thread del kernel. Secondo htop, il sistema è essenzialmente inattivo (1-2% di utilizzo della CPU nel sistema, un carico di 0,10).
  • La mia macchina utilizza la grafica integrata Intel HD e non ha altre schede grafiche . Una scheda nVidia era un'opzione per questo modello, come notato da @braiam; Non ho optato per questo.
  • @terdon ha richiamato le impostazioni del regolatore della CPU. Le mie CPU sono impostate supowersave
  • Il mio processore specifico è un Core i7-2620M da 2,7 GHz.

Modifica : al momento della stesura di questa domanda, il mio fancontrol non funzionava correttamente e funzionava continuamente a un intervallo di giri medio (3900 giri / min), anche a temperature elevate. Su suggerimento di @Alex e @JustDanyul, questo è stato risolto. Il problema di fondo, tuttavia, rimane ancora.


1
Come suggerisce slm, se la CPU è inattiva ma la temperatura interna è troppo elevata, l'unica spiegazione possibile è che il calore in eccesso non è stato dissipato dopo un certo evento - l'unica cosa che può produrre un calore significativo è la CPU. Pensa di accendere completamente un bruciatore per far bollire un po 'd'acqua, quindi mettere un coperchio su di esso e abbassare il bruciatore verso il basso: l'acqua rimane bollente perennemente perché il calore non può dissipare velocemente come il bruciatore basso lo sostituisce finché il coperchio è acceso . Smontalo e puliscilo se è così male, solo soffiare aria probabilmente non aiuterà molto a questo punto.
Riccioli d'oro

Lo separerò sicuramente e lo pulirò poiché sospetto di avere alcuni problemi di flusso d'aria, ma poiché è la CPU manterrà una temperatura elevata costante indefinitamente dopo qualunque evento che causi l'estremo cambiamento di temperatura. Anche se lasci il coperchio sulla pentola, la temperatura dell'acqua scende ad un certo punto. La mia temperatura colpisce un numero e rimane semplicemente lì, costantemente a quel numero, per sempre fino al riavvio. Non esiste un graduale sviluppo di calore che suggerisca che abbia problemi di dissipazione. Ho corso a pieno carico tutta la mattina e sono seduto a 41 gradi.
numeri 1311407

Per dirla in altro modo, la mia temperatura si regolerà normalmente sotto lo stress previsto. Se sto eseguendo una compilazione difficile, potrebbe riscaldare fino a 60, 70 gradi, ma una volta terminato si raffredderà.
numeri 1311407

Oltre alla ventola, potresti voler riapplicare la pasta termica. La pasta termica più economica si dissiperà nel tempo.
BlueRaja - Danny Pflughoeft

1
Forse questa è una domanda stupida, ma per caso hai disabilitato ACPI? Qualche tempo fa ho avuto problemi simili con un vecchio PC, che non si avviava con questa opzione abilitata, dopo averlo disabilitato, alla fine si è avviato, ma si stava anche surriscaldando.
Alko,

Risposte:


6

Il fan

Anche il mio lo fa, eseguendo Fedora 14. Prova a ottenere una bomboletta d'aria compressa e a far esplodere le prese d'aria sul retro e sul lato del case.

Inoltre periodicamente deciderai di rimuovere la tastiera e soffiare aria compressa direttamente sulle pale della ventola. Si incrostano di polvere e iniziano a comprometterne l'efficacia appesantendola.

La cosa migliore dei Thinkpad sono i manuali di servizio! Ti mostrano come abbattere il tuo laptop e rimetterlo insieme.

Processo errato

L'altra cosa che ho notato è che occasionalmente avrò un processo che è andato storto e consumerà il 100% di uno dei core. Uccidere questo processo di solito riporta la temperatura alla normalità.

Puoi usare htopo topper vedere di che processo si tratta e ucciderlo dal loro o da un terminale usando esso PID.

cos'altro?

Vedi la mia risposta a queste domande e risposte per ulteriori suggerimenti su come ottenere letture della temperatura per i vari componenti del laptop. Il Q&A è intitolato: Come ottenere la temperatura interna dei core i7 di haswell in i3status .


Questo è sicuramente qualcosa che dovrei fare, ma la cosa strana per me è il motivo per cui va solo in uno stato caldo a volte e persiste fino al riavvio, il che risolve immediatamente il problema. Sembra che debba succedere qualcosa che sta innescando il persistente cambiamento di calore. Ho corso htop senza successo. L'utilizzo della CPU è normale.
numeri 1311407

Forse qualche segnale di risveglio con il kernel?
Braiam,

1
@slm grazie, non l'ho provato. Lo farò la prossima volta che inizia a surriscaldarsi e riferire i risultati.
numeri 1311407

1
@ numeri1311407: potrebbe essere il motivo per cui il riavvio risolve rapidamente il problema è che questo spegne la CPU per alcuni secondi consentendo alla temperatura di scendere al di sotto del punto di interruzione. La CPU è sempre più calda di ambiente, qualunque sia "ambiente".
Riccioli d'oro

1
Si noti che nel topcomando è possibile premere "1" per visualizzare il carico dei singoli core.
Christian Stewart,

3

Questo è più di un lungo commento ma dovresti dare un'occhiata a thinkwiki.org , è la risorsa per Linux su ThinkPads. Per quanto riguarda la temperatura, ho avuto problemi simili con il mio t4500 e l'ho risolto giocando

  1. Il regolatore della CPU che controlla il ridimensionamento della frequenza della CPU. Le tue scelte sono:

    • Le prestazioni mantengono la CPU alla massima frequenza possibile
    • Powersave mantiene la CPU alla frequenza più bassa possibile
    • Userspace esporta le informazioni di frequenza disponibili a livello di utente (tramite il file system / sys) e consente il controllo dello spazio utente della frequenza della CPU
    • Ondemand ridimensiona le frequenze della CPU in base all'utilizzo della CPU (come fanno i demoni di ridimensionamento della frequenza dello spazio utente, ma nel kernel)
    • Il conservatore si comporta come la ondemand ma aumenta la frequenza passo dopo passo

    Con ondemand , la tua CPU funzionerà alla massima velocità solo quando necessario. Idealmente, questo sarà completamente trasparente per te, la tua macchina funzionerà semplicemente alla velocità necessaria per le attività correnti. Per attivarlo, fallo

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. Controllo della ventola. Esiste una utilissima utility chiamata " Simple ThinkPad Fan Control " che ti permette di mettere a punto le temperature di innesco che cambiano la velocità della ventola. Dai un'occhiata anche alle informazioni qui .


Grazie, è molto utile. Mi sono imbattuto in quel wiki prima, ma non ho mai veramente notato cosa fosse esattamente.
numeri 1311407

Solo per notare, tutte le mie CPU sono in esecuzionepowersave
numeri 1311407

1

Penso che ci sia un problema su ciò che percepisci come "caldo". Per il Thinkpad t420 ( secondo i forum ) è di circa 80-85 ° C e dimentichiamo la scheda nVidia che potrebbe causare un aumento della temperatura (in effetti la configurazione di Optimus potrebbe non funzionare bene, costringendo la CPU a fare funzionare la GPU). Che dire, la tua massima CPU temperatura tollerata è 100 ° C (se arriva lo spegnimento del sistema volontà), mentre l'atmosfera è di circa 10,0 ° C a 35,0 ° C . Detto questo, se il tuo laptop rientra nell'intervallo è tutto ok (tranne per la durata della batteria e del laptop).

Ora volevi segnalare possibili sospetti. Sotto questo aspetto, direi che la scarsa implementazione di nVidia con Linux potrebbe gettare lavoro sulla tua CPU che non verrà mostrata in htop (o da nessuna parte) a causa del loro famigerato sistema On-Demand Optimus, che sembra adattarsi alla tua situazione attuale ( funziona bene fino a un momento, inizia a riscaldare senza controllo). È necessario aggiornare l'installazione fino a quando Bumblebee non è completamente configurato. È possibile utilizzare il bbswitchper separare la scheda nVidia a piacimento e vedere come va.

Per installare Bumblebee per Arch è possibile trovare il pacchetto sul repository. Se non l'hai ancora installato.


Non ho optato per la scheda nVidia su questa macchina. Mi dispiace, avrebbe dovuto essere più chiaro su questo nella domanda. E mentre 80-85 non è troppo caldo , è ancora più caldo della metà degli anni '40, che è ciò che il mio computer normalmente esegue su un tipico carico di lavoro leggero. Il mio problema sta cercando di determinare quale condizione fantasma "entra in gioco" e fa sì che il mio 45 costante sia un 80-85 coerente.
numeri 1311407

1

i sensori mostrano che la mia ventola ronza a ~ 3900 RPM

Anche con temperature come ~ 75-90 ° C?

poiché l'accelerazione manuale del ventilatore raffredda temporaneamente la macchina

Quindi un problema è solo che la velocità della ventola non funziona automaticamente?

Dimentica l'auto, puoi leggere correttamente la temperatura e puoi controllare manualmente la velocità della ventola, giusto? Se è così, tutto ciò che devi fare è trovare uno script di controllo della ventola funzionante o implementare il tuo (esegui il polling della temperatura e imposta la velocità secondo una tabella temp[i]=speed[i], quando imposti una velocità più elevata mantienila per un po 'anche se la temperatura scende , quando devi rallentare la velocità, fallo lentamente e passo dopo passo).

Per quanto riguarda il sondaggio, il migliore sarebbe avere un demone di monitoraggio della temperatura che inneschi eventi di cambiamento termico e lo script di controllo della ventola che ascolti / aspetti quegli eventi, ho pensato (forse a torto) una volta, acpidma al giorno d'oggi non lo so.

In entrambi i casi (il tuo script personale / esistente) mentre non sei sicuro della soluzione, tieni sempre d'occhio temperatura e RPM, la ventola non deve fermarsi.

Risolvi autoprima questo problema e se il surriscaldamento persiste puoi concentrarti sulla causa.

modificare

Potresti voler provare uno strumento come lttngraccogliere le statistiche di tutto il sistema nel tempo, ma potrebbe non essere facile da configurare e potrebbe essere costoso in termini di archiviazione se hai bisogno di raccogliere per molto tempo.


Hai ragione sul fatto che il mio fancontrol funzioni male, se non del tutto. Vedrò come farlo reagire correttamente, ma risolverlo non risolverà la causa sottostante. Potrei lasciar perdere tutto al giorno a un massimo di 6400 giri al minuto e rinfrescarmi un po ', ma è la causa che sto cercando di affrontare.
numeri 1311407

1

Poiché l'accelerazione manuale della ventola risolve il problema, questo sarebbe un posto eccellente per iniziare la risoluzione dei problemi, poiché ciò sembra suggerire che il controllo automatico della ventola non funziona.

Ora, esegui arch linux, che è una brillante distribuzione (sì, anch'io lo eseguo) con un wiki fantastico. Quindi, devo chiedere, hai RTFM? ; p

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

Per quanto posso vedere, è necessario:

  1. abilita il modulo del kernel thinkpad_acpi
  2. installare e configurare l'applicazione thinkfan da AUR
  3. abilitare il servizio di sistema thinkfan

È stato fatto tutto questo?

AGGIORNAMENTO Sono felice di sapere che il tuo fan ora sta funzionando correttamente, piuttosto che girare su un mezzo felice. (Presumo che ciò abbia risolto il problema del funzionamento della macchina a temperature superiori a 80 gradi?)

Per quanto riguarda la risposta, qual è la causa alla base di un cambiamento di temperatura di 30 gradi, beh, sono tentato di chiedere: non potrebbe essere perché il tuo fan non funzionava correttamente?

Postuliamo che,

  • il processore non funziona più del normale
  • le fluttuazioni di temperatura vengono ora sostituite con fluttuazioni della velocità della ventola

Non sarebbe sicuro supporre che potrebbe non esserci affatto un problema e che il problema era semplicemente che il tuo fan stava funzionando a un livello in cui stava appena affrontando? E piccoli cambiamenti nella temperatura ambiente, ecc., Lo hanno messo oltre il limite delle sue capacità?

Ad esempio, avevo un laptop Acer e nelle giornate calde la ventola girava "costantemente" su e giù. Scommetto che se il mio fan non fosse in grado di regolarsi da solo, avrei visto anche variazioni di temperatura abbastanza grandi :)


Ho appena installato thinkfan. Grazie per l'attenzione. Sì, l'arco wiki dettagliato è un grande vantaggio della distribuzione. Ci sono stato mille volte ma non mi sono mai imbattuto o ho pensato di cercare una pagina dedicata al mio modello esatto, e non avevo mai visto Thinkfan menzionato. Bella piccola sceneggiatura. Detto questo , questo non risolve il mio vero problema: come faccio a diagnosticare la causa della mia temperatura insolitamente alta? Anche se ho disinserito il controllo remoto e liberato la cosa al massimo RPM, sta solo mettendo un cerotto sul vero problema del calore misterioso.
numeri 1311407,

No, il problema esiste ancora invariato. Sono seduto qui in questo momento a 42 gradi. Quando si verifica la mia condizione di calore, eseguirò gli stessi processi, l'ambiente sarà equivalente, nulla apparentemente sarà cambiato, ma la mia temperatura salirà da un costante 42 a un costante 75+. Io posso raffreddarlo: metterlo su un dispositivo di raffreddamento portatile, disinserire la fancontrol permettendo di a rotazione a 6500 giri, ecc Ma se mi arresto, sarà riscaldare di nuovo fino a 75+. La ventola alla massima velocità è solo leggermente più veloce di quanto non andasse comunque. Risolvere il problema è stato positivo, ma non una soluzione al problema di fondo.
numeri 1311407,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.