Errori hardware della CPU in Ubuntu 17.04


12

Qualcuno può spiegarmi quali sono questi messaggi di errore che ho visualizzato quando ho guardato in dmesg? Sono nuovo di Ubuntu e del mondo Linux.

[ 7.802351] CPU4: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802352] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802353] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802354] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802356] mce: [Hardware Error]: Machine check events logged
[ 7.802362] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802363] mce: [Hardware Error]: TSC 99561677c
[ 7.802385] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.802387] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880a0003
[ 7.802387] mce: [Hardware Error]: TSC 995616be4
[ 7.802388] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.802389] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802390] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802391] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.802392] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[ 7.826359] CPU4: Core temperature/speed normal
[ 7.826359] CPU0: Core temperature/speed normal
[ 7.826360] CPU2: Package temperature/speed normal
[ 7.826361] CPU6: Package temperature/speed normal
[ 7.826361] CPU0: Package temperature/speed normal
[ 7.826362] CPU4: Package temperature/speed normal
[ 7.826363] mce: [Hardware Error]: Machine check events logged
[ 7.826367] mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826368] mce: [Hardware Error]: TSC 99916f004
[ 7.826369] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 1 microcode ba
[ 7.826369] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 128: 00000000880b0002
[ 7.826370] mce: [Hardware Error]: TSC 99916f2ca
[ 7.826370] mce: [Hardware Error]: PROCESSOR 0:506e3 TIME 1501537538 SOCKET 0 APIC 0 microcode ba
[ 7.826400] CPU1: Package temperature/speed normal
[ 7.826401] CPU5: Package temperature/speed normal
[ 7.826402] CPU3: Package temperature/speed normal
[ 7.826402] CPU7: Package temperature/speed normal
[ 467.922330] CPU4: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922331] CPU0: Core temperature above threshold, cpu clock throttled (total events = 73)
[ 467.922332] CPU7: Package temperature above threshold, cpu clock throttled (total events = 86)
[ 467.922333] CPU3: Package temperature above threshold, cpu clock throttled 

Sto eseguendo Ubuntu 17.04 con kernal generico 4.10.0-29


o è un bug software che ho lo stesso nel mio registro di un nuovo Lenovo T480S vedi bugs.launchpad.net/ubuntu/+source/linux/+bug/1781924
Rolf Schumacher

Risposte:


8

La CPU si sta surriscaldando e sta entrando in MCE (eventi di controllo macchina) ... vale a dire: si sta bloccando. Se non vedi altri eventi relativi alla temperatura in syslog, probabilmente è perché il tuo dispositivo di raffreddamento della CPU / ventola / tubo termico / pasta termica non sta facendo il lavoro.

  • Controlla syslog con questo terminalcomando ...

    grep -i -e temp -e therm /var/log/syslog*
    
  • Se la macchina è molto sporca / polverosa, ciò potrebbe svolgere un ruolo importante nel surriscaldamento della macchina. Puliscilo.

  • Se la tua macchina ha processori Intel, assicurati che intel-microcodesia installato.

    sudo apt-get update
    sudo apt-get install intel-microcode
    reboot
    
  • Installa thermaldper provare e controllare la temperatura.

    sudo apt-get update
    sudo apt-get install thermald
    reboot
    
  • Controlla la tua versione del BIOS. Immettere il BIOS all'accensione e annotare la versione #. Vai al sito Web del produttore con la marca / modello del tuo computer. Vai alla sezione supporto / download e guarda se c'è un BIOS più recente.

  • Infine, e molto probabilmente, se si tratta di una macchina più vecchia, il composto termico che si trova tra i processori e il suo tubo di calore / dispositivo di raffreddamento della ventola deve essere riapplicato. Ciò richiede una certa esperienza tecnica.


1
Che impatto intel-micorocodeha sulla temperatura?
gene_wood,

@gene_wood, come ho già detto, è probabilmente un problema di polvere, ventola o composto termico e controllare il microcodice è solo un altro passo per aiutare a diagnosticare il problema da remoto. Il vecchio microcodice della CPU può causare vari problemi. Secondi per verificarlo.
heynnema,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.