Dell Inspiron Running Debian si spegne con un uso intenso


1

Non so se si tratta di un problema Debian o hardware, ma le informazioni sono in Linux.

Ho Debian 6.7 installato su un Dell Inspiron 520 (chip AMD). Ottengo le informazioni sulla CPU con

less /proc/cpuinfo

che risulta in

processor       : 0
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 6
model name      : AMD Athlon(tm) II X2 250 Processor
stepping        : 3
microcode       : 0x10000b6
cpu MHz         : 800.000
cache size      : 1024 KB
physical id     : 0
siblings        : 2
core id         : 0
cpu cores       : 2
apicid          : 0
initial apicid  : 0
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc extd_apicid pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt hw_pstate npt lbrv svm_lock nrip_save
bogomips        : 6000.65
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate

processor       : 1
vendor_id       : AuthenticAMD
cpu family      : 16
model           : 6
model name      : AMD Athlon(tm) II X2 250 Processor
stepping        : 3
microcode       : 0x10000b6
cpu MHz         : 800.000
cache size      : 1024 KB
physical id     : 0
siblings        : 2
core id         : 1
cpu cores       : 2
apicid          : 1
initial apicid  : 1
fpu             : yes
fpu_exception   : yes
cpuid level     : 5
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nopl nonstop_tsc extd_apicid pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt hw_pstate npt lbrv svm_lock nrip_save
bogomips        : 6000.02
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate

Ho installato psensor per monitorare la temperatura. Può andare fino al 100% di utilizzo con la temperatura della CPU che rimane al di sotto di 50 ° C. Tuttavia, con un'applicazione di lunga durata, ad alta intensità di CPU, come

sudo maldet --scan-all /

il computer si spegne prima che l'applicazione sia terminata. Una volta la luce di alimentazione era ancora accesa e c'era un forte piagnucolio dal desktop. Ho sostituito la pasta termica sulla CPU con Arctic Silver. Durante il normale funzionamento, la temperatura sale a circa 46, anche con un utilizzo della CPU del 100%. La rimozione del lato del computer non ha provocato un notevole cambiamento nella temperatura della CPU.

mi sono imbattuto

sudo dmidecode |grep -B 2 Stat

e ottenuto

Serial Number: DST5MS1
Asset Tag: 
Boot-up State: Safe
Power Supply State: Safe
Thermal State: Safe
Security Status: None
--
Max Speed: 3000 MHz
Current Speed: 3000 MHz
Status: Populated, Enabled
--
Handle 0x0017, DMI type 32, 20 bytes
System Boot Information
Status: No errors detected

Quando sono entrato

sensors

ho ottenuto

k10temp-pci-00c3
Adapter: PCI adapter
temp1: +16.5°C (high = +70.0°C)

it8720-isa-0a10
Adapter: ISA adapter
in0: +1.07 V (min = +0.00 V, max = +4.08 V)
in1: +1.10 V (min = +0.00 V, max = +4.08 V)
in2: +3.02 V (min = +0.00 V, max = +4.08 V)
+5V: +3.01 V (min = +0.00 V, max = +4.08 V)
in4: +3.33 V (min = +0.00 V, max = +4.08 V)
in5: +2.14 V (min = +0.00 V, max = +4.08 V)
in6: +2.14 V (min = +0.00 V, max = +4.08 V)
5VSB: +2.96 V (min = +0.00 V, max = +4.08 V)
Vbat: +3.25 V 
fan1: 816 RPM (min = 0 RPM)
fan2: 888 RPM (min = 0 RPM)
temp1: +23.0°C (low = -1.0°C, high = +127.0°C) sensor = thermal diode
temp2: +33.0°C (low = -1.0°C, high = +127.0°C) sensor = thermal diode
temp3: -128.0°C (low = -1.0°C, high = +127.0°C) sensor = disabled
cpu0_vid: +0.375 V
intrusion0: ALARM

Ho sostituito l'alimentatore con questo

Ho deciso di fare uno stress test correndo

sudo maldet --scan-all /

in una finestra terminale. Questa chiamata dura ore ed è molto impegnativo per la CPU. psensor ha fatto in modo che la ventola 1 scendesse improvvisamente da 830 a 770 e poi iniziasse a insinuarsi lentamente. Ma la temperatura della CPU è aumentata gradualmente dalla metà degli anni '30 ai bassi anni '40. Maldet era a circa un quarto di distanza quando sono arrivato per la notte con la temperatura nei bassi anni '40. La mattina dopo il computer aveva smesso di funzionare. Non è stato solo il cursore da quando ho eseguito un sito Web sul PC e non sono stato in grado di accedervi.

Per escludere il desktop di Gnome, ho riavviato Debian e ho fatto ctrl-alt-F4 per passare alla riga di comando di base. Allora ho corso

sudo maldet --scan-all /

Funzionò per alcune ore e il PC iniziò questo piagnucolio abbastanza acuto e rumoroso e sullo schermo c'erano molti testi casuali che continuavano a cambiare. Era difficile dire da dove venisse. Scollegare il disco rigido ha interrotto il testo ma non il lamento, quindi sospetto che sia l'alimentatore.

Ho iniziato a eseguirlo di nuovo, questa volta con l'alimentatore esterno al PC in modo da poter essere sicuro che fosse l'alimentatore. Dopo circa un'ora, sullo schermo è apparso il seguente testo. (Potrei aver perso le prime poche righe dallo scorrimento fuori dalla vista.)

test_tsk_need_resched
check_preempt_cur
ttwu_do_wakeup
x86_pmu_config_addr
paravirt_write_msr
perf_ctx_adjust_freq
read_tsc
timekeeping_get_ns
ktime_get_update_offsets
hrtimer_interrupt
test_tsk_need_resched
resched_tsk
check_preempt_curr
ttwin_do_wakeups
smp+apic_timer
apic_timer_interrupt
copy_pte_range
copy_page_range
dup_mn
copy_process
do_fork
stub_clone
system_call_fastpath

A questo punto, il PC ha smesso di rispondere ai ritorni a capo della tastiera.

Modificare:

Ho testato la memoria con

sudo /usr/bin/memtester 5 1

e ottenuto

memtester version 4.2.2 (64-bit)
Copyright (C) 2010 Charles Cazabon.
Licensed under the GNU General Public License version 2 (only).

pagesize is 4096
pagesizemask is 0xfffffffffffff000
want 5MB (5242880 bytes)
got  5MB (5242880 bytes), trying mlock ...locked.
Loop 1/1:
  Stuck Address       : ok         
  Random Value        : ok
  Compare XOR         : ok
  Compare SUB         : ok
  Compare MUL         : ok
  Compare DIV         : ok
  Compare OR          : ok
  Compare AND         : ok
  Sequential Increment: ok
  Solid Bits          : ok         
  Block Sequential    : ok         
  Checkerboard        : ok         
  Bit Spread          : ok         
  Bit Flip            : ok         
  Walking Ones        : ok         
  Walking Zeroes      : ok         
  8-bit Writes        : ok
  16-bit Writes       : ok

Done.

Risposte:


2

Controllare che il dissipatore di calore della CPU non sia ben fissato (verificare la presenza di composti o mancanza di) controllo della ventola e ho visto la memoria colpevole su queste macchine, inoltre l'alimentatore non sarebbe una cattiva idea testarlo con uno nuovo. Tutti i tuoi indicatori indicano possibili problemi hardware.


Grazie per la risposta. Ho aggiunto Arctic Silver al dissipatore di calore della CPU e ho pulito la CPU e il lavandino. I fan sono tutti in esecuzione. Ho sostituito l'alimentatore con questo. amazon.com/dp/B003CO04CU/?tag=stackoverfl08-20 . Il problema persiste. Ho modificato la domanda originale per fornire i risultati di un test di memoria. Grazie,
OtagoHarbour,

2

Non vedo come questo potrebbe essere un problema software. Devi rintracciare quel rumore. Se il tuo alimentatore è nuovo di zecca ed è stato utilizzato in sostituzione a causa di questo problema, probabilmente non è anche la causa.

Non del tutto imparentato, ma hai provato qualcosa che sottolinea solo la CPU e non il disco? Puoi usare:

pyrit benchmark_long

Controllare il registro del kernel sul sistema appena prima che si arrestasse in modo anomalo. Forse c'è qualcosa di utile.

Se vuoi essere totalmente sicuro che non sia legato al software, procurati un CD di avvio di Linux ed esegui alcuni stress test. Se si arresta in modo anomalo, è molto probabile che sia un problema hardware. O meglio ancora, prova un altro sistema operativo.

Durante lo stress test, continua a guardare la temperatura e tieni d'occhio dmesg o il registro del kernel per i messaggi di errore.

MODIFICARE

Gli errori di memoria possono anche causare problemi del genere. Prova memtest86, ha funzionato per me in passato. È un CD di avvio, indipendente dal sistema operativo. Sembra catturare tutto.

http://www.memtest86.com/


Sembra che l'alimentatore provenisse dall'alimentatore che ho sostituito. Non l'ho sentito da quando l'alimentatore è stato sostituito. Sto correndo con Pyrit ora. Grazie,
OtagoHarbour,

Pyrit ha portato la temperatura 1 e la temperatura 2 (su psensor) fino a 57 ° C e 55 ° C rispettivamente. Quindi i fan si sono scatenati e hanno portato le temperature a circa 54 ° C fino alla fine di Pyrit. Queste sono le temperature più alte che ho visto su questa scommessa PC che non hanno causato il blocco del sistema. Non c'erano nuovi messaggi in dmesg. Grazie,
OtagoHarbour,

@OtagoHarbour Dai un'occhiata alla mia modifica alla risposta
Ryan Babchishin,

Mi dispiace per la mia risposta lenta. Avevo installato memtest86 usando "sudo apt-get install memtest86 +" ma non sono riuscito a trovare un eseguibile dopo l'esecuzione dell'installazione. Stavo per provare il tuo link ma ho scoperto che il PC si era spento. Ho premuto il pulsante di accensione e ho ricevuto un flusso continuo di bip rapidi, ho lanciato la B sopra la C centrale o 494 Hz. L'avvio è arrivato solo fino a dove ha mostrato l'opzione per il tasto F12 e si è fermato lì. Deve essere un problema hardware. Ho guardato i codici bip del Del Inspiron ma non sembrano avere nulla per i bip continui. Grazie,
OtagoHarbour,

1
@OtagoHarbour Mi dispiace sentirlo. Credo che il pacchetto memtest86 configuri memtest in modo che funzioni dal menu di grub. Dovresti vederlo all'avvio. In caso contrario, scarica l'ISO e masterizzalo. In realtà non è un'applicazione Linux.
Ryan Babchishin,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.