Su un server con doppia CPU, è normale che una CPU funzioni più a caldo dell'altra?


51

Ho un doppio server Opteron che esegue Linux con libvirt per ospitare diverse macchine virtuali. Le macchine virtuali funzionano bene e il server funziona correttamente, ma noto che una CPU funziona sempre a 69 ° C (valvole a farfalla a 70 ° C) e l'altra a circa 15 ° C.

Questo non mi sembra normale? Non dovrebbero essere entrambi un po 'più vicini alla temperatura?

Non sono sicuro di come Dianose ulteriormente. Forse non c'è abbastanza pasta termica su una delle CPU?

Modifica: la scheda madre è ASUS KGPE-D16 e raffreddata dai doppi fan Noctua NH-U9DO .

Si noti che penso che le temperature potrebbero essere inferiori al di sopra dell'ambiente, piuttosto che valori assoluti? Quando il server è inattivo, le temperature della CPU scendono a 2 ° C e 13 ° C. Sto usando la configurazione di lmsensors da qui


1
Che cos'è la marca / modello del server?
ewwhite,

2
Come è la distribuzione del carico della CPU? mpstat -P ALL 1su Linux aiuterà
Christopher Perrin,

3
suona come un sensore di temperatura rotto
matcheek,

14
Il 15 ° C è molto probabilmente un incensiere rotto ...
Reagisce il

Sembra un sensore rotto o mal calibrato, se riesci a riavviare il server, dai un'occhiata al BIOS che dovrebbe visualizzare i valori corretti.

Risposte:


106

Il problema finì per essere un dissipatore di calore inadatto. Forse male adattarsi non è la descrizione giusta. Si scopre, devi mettere la pasta termica sul dissipatore di calore, non la copertura di plastica che passa sopra il dissipatore di calore.

inserisci qui la descrizione dell'immagine

Dopo aver rimosso il coperchio di plastica, la CPU è bella e carina, grazie a tutti!


51
+1 solo perché è divertente
HBruijn

9
Vuoi dire che qualcuno ha lasciato il coperchio di plastica sul posto e poi ha messo la pasta su di esso e poi ha messo il dissipatore di calore su quello? Epico.
TomTom,

4
Baaaaaahaaahaaahahahaa !!
Craig,

8
Adoro come puoi vedere i termini e le condizioni, la garanzia limitata e la politica di restituzione in background. :)
Gare leggerezza Monica

6
Se ti fa sentire meno stupido, (e non lo farà), ho fatto una cosa simile con la mia nuova caffettiera da ufficio. Il caffè era troppo freddo per essere bevuto e lo stavo preparando per tornare al negozio prima che un disco di cartone protettivo cadesse dall'elemento riscaldante :)
Martin James,

25

Nella mia esperienza, è normale che i componenti accoppiati in un caso funzionino a temperature diverse, perché il flusso d'aria non è lo stesso ovunque. Ecco un grafico della temperatura dell'HDD dalla mia scatola di colori. Le unità sono speculari, quindi i carichi di lavoro su di essi sono quasi identici.

grafico delle temperature degli HDD nell'ultimo anno

Come puoi vedere, si tracciano a vicenda, ma non sono gli stessi; sono anche, in media, solo 6C a parte. Indipendentemente dal fatto che i tuoi sensori segnalino la temperatura assoluta o la sovratemperatura, una differenza di 55 ° C sotto carico sembra molto sbagliata. Se hai la certezza che i dati siano corretti, quindi data la differenza quiescente scende a 10 ° C, che è il tipo di differenza che vedo a causa del flusso d'aria, sospetterei che un dissipatore di calore montato male.


1
Usando mpstat (grazie a Christopher Perrin, grazie!) Ho confermato che il carico è distribuito in modo abbastanza uniforme. Le cose vanno al minimo in questo momento a + 3 ° C e + 20 ° C. Proverò a giocherellare con il dissipatore di calore per vedere se è allentato. Pensi che potrebbe essere un problema di pasta termica?
samoz,

Questo è molto possibile (e ancora di più dopo aver iniziato a muoverlo).
MadHatter supporta Monica il

8

Non è. A meno che tu non abbia seri problemi con il flusso d'aria. O uno dei dispositivi di raffreddamento è cattivo. La temperatura può variare - ma non molto (70 contro 15 gradi Celsius).

Considerando quanto sono bassi i 15 gradi suppongo (a) che il tuo sensore sia spento (memorizzi davvero il server in una stanza così fredda?).

Suppongo anche che una delle CPU semplicemente non funzioni affatto, per qualsiasi motivo.

Le piccole differenze sono normali. Potrebbero essere alcuni più piccoli (mi viene in mente il flusso d'aria). ma qui parliamo di uno che è FREDDO.


2

Potrebbe trattarsi di un raffreddamento o di un caricamento non uniforme (data la differenza di temperatura, la tua situazione è probabilmente un caricamento non uniforme). Dovresti usare qualcosa come prime95 per caricare tutti i core in modo uniforme e vedere se le temperature variano ancora. In caso contrario, è necessario bilanciare le macchine virtuali, verificare che le app siano multithread e occupate. Il modo in cui farlo dipende dal software e dal carico di lavoro individuale, quindi va oltre lo scopo della domanda. Tieni presente che non esiste alcun vantaggio reale nel fare questo se non hai abbastanza carico per completare un singolo CPU / core, infatti la tua VM potrebbe deliberatamente evitare di utilizzare un secondo CPU in modo che possa entrare in modalità di risparmio energetico su multi -cpu systems.

Se è stato ridotto al raffreddamento. Una piccola differenza fino a 10 ° C potrebbe essere una pasta termica troppo piccola (o troppo!). Una differenza maggiore indica un problema significativo o una differenza tra i dispositivi di raffreddamento della CPU. È possibile che uno abbia bloccato il flusso d'aria, un dissipatore di calore sia stato staccato, ecc.


0

Dovrei essere d'accordo, temp difettoso. sensore, poiché 15C è solo 59F !!! A meno che il computer non si trovi in ​​un data center estremamente gelido, immagino che la temperatura dell'aria ambiente sarebbe superiore a 59F! Si tenta di assegnare le macchine virtuali al core a bassa temperatura e vedere se ci sono cambiamenti; in caso contrario, sospetterei fortemente che il sensore sia difettoso.

Potresti anche voler guardare l'output di dmesg(messaggi di avvio) e vedere se c'è qualcosa di insolito lì.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.