Uno dei nostri LCD Dell PowerEdge mostrava "Errore controllo macchina CPU 2", ma non sono riuscito a trovare nulla nei log relativi a MCE o "Errore hardware". Ho cancellato il messaggio, ma volevo far funzionare la macchina attraverso alcune cose pesanti per vedere se potevo farlo inciampare di nuovo.
Ho usato uno script bash a ciclo infinito eseguito 64 volte (una volta per ogni core) per alcuni minuti. Quindi ho usato un programma chiamato "stress" per fare la stessa cosa con CPU e memoria. La mia domanda è: qual è l'importo sufficiente prima che sia generalmente OK dire "ok, questa macchina è buona per andare"? Pochi minuti? Un'ora? Finché le temperature della CPU rimangono OK?