Come diagnosticare blocchi e blocchi del computer?


29

Ho creato un computer desktop un paio di anni fa con le seguenti specifiche:

  • CPU: Intel Core 2 Quad Q9300 Yorkfield 2.5GHz 6 MB L2 Cache LGA 775 Processore quad-core 95W BX80580Q9300
  • Scheda madre: EVGA 122-CK-NF68-T1 LGA 775 NVIDIA nForce 680i SLI ATX Intel Motherboard
  • Scheda video: due EVGA 256-P2-N758-TR GeForce 8600GT SCC 256 MB GDDR3 PCI Express x16 SLI con scheda video supportata da 128 bit
  • Alimentatore : SeaSonic S12 Energy Plus SS-550HT 550W ATX12V V2.3 / EPS12V V2.91 SLI Certified CrossFire Ready 80 PLUS Alimentatore PFC attivo certificato
  • Memoria: due G.SKILL 4 GB (2 x 2 GB) 240-pin DDR2 SDRAM DDR2 800 (PC2 6400) Kit di memoria desktop a doppio canale Modello F2-6400CL5D-4GBPQ

Fin dalla sua istituzione, la macchina si è periodicamente bloccata, la regolarità è variata negli anni da una volta al giorno a una volta al mese. In genere, i blocchi avvengono una volta ogni pochi giorni.

Per "blocco" intendo che il mio computer si blocca. Lo schermo si blocca, non riesco a muovere il mouse. Premere i tasti sulla mia tastiera che normalmente accendono o spengono i LED sulla tastiera (come Blocco maiuscole) non accendono o spengono i LED. Se al momento del blocco c'era musica in riproduzione, i rumori continuano a uscire dagli altoparlanti, ma è solo la frequenza / nota corrente che viene riprodotta indefinitamente. Non esiste BSOD.

Quando si verifica un tale blocco, devo eseguire un riavvio forzato spegnendo il computer o premendo il pulsante di ripristino.

Ho la versione più recente dei driver hardware NVIDIA e li aggiorno semi-regolarmente, ma questo non sembra aiutare. Attualmente sto utilizzando Windows 7 x64, ma in precedenza utilizzavo Windows Server 2003 x64 e avevo gli stessi problemi di blocco.

La mia ipotesi è che sia in qualche modo correlato al driver video o alla scheda madre, ma non so come fare per diagnosticare questo problema per restringere quale dei due è il colpevole.


Ulteriori informazioni su: raffreddamento Riguardo al raffreddamento ... Non ho installato alcun sistema di raffreddamento post-vendita a parte due ventole normali che ho recuperato da un computer più vecchio. La ventola sopra la CPU è quella fornita con essa. Uno dei due fan scavati l'ho aggiunto situato nella torre inferiore dell'angolo, nel tentativo di creare un flusso d'aria da davanti a dietro. Il secondo fan è puntato direttamente verso le due schede video.


Installazione e letture di SpeedFan Su suggerimento di studiohack, ho installato SpeedFan , che forniva le seguenti letture della temperatura:

  • GPU: 63C
  • GPU: 65C
  • Sistema: 76C
  • CPU: 64C
  • AUX: 36C
  • Core 0: 78C
  • Core 1: 76C
  • Core 2: 79C
  • Core 3: 79C

Aggiornamento n. 3: un altro blocco :-( Beh, ho avuto un altro blocco la scorsa notte. :-( SpeedFan ha riportato la temperatura della CPU a 38 ° C quando è successo, e non c'è stato alcun picco di temperatura che porta al congelamento.

Una cosa che noto è che il congelamento sembra più probabile che accada se guardo un video. In effetti, degli ultimi 5 blocchi dell'ultimo mese, 4 sono stati mentre guardavano un video su Flickr. Non necessariamente lo stesso video, ma comunque un video. Non so se questa sia solo una coincidenza o se significhi qualcosa. (A parte ogni sera, prima di coricarmi, mia figlia di 2 anni si siede sulle mie ginocchia e guarda alcuni video casalinghi su Flickr e, nell'ultimo mese, ha appreso la frase "Uh oh, il computer si è rotto.")


Aggiornamento n. 4: risultati dei test MemTest86 e 3DMark06 :

Per i suggerimenti nei commenti, ho eseguito MemTest86 durante la notte e ha ciclicato 5 volte senza errori gli 8 GB di memoria. Ho anche eseguito il test 3DMark06 senza problemi (vedere i miei punteggi su http://3dmark.com/3dm06/15163549 ).

Così quello che ora? :-)

Ulteriori suggerimenti su cosa controllare? C'è un modo per ottenere una traccia dello stack o qualcosa del genere quando il computer si blocca in quel modo?

Risoluzione

Non ho mai capito i problemi particolari, ma sulla base dei suggerimenti qui e altrove, presumo che sia stato un problema con la scheda madre. In ogni caso, di recente ho aggiornato il mio sistema, acquistando una nuova mamma-barba, un alimentatore, una CPU e una RAM, e quel nuovo impianto ha funzionato magnificamente nelle ultime settimane. Sto usando le stesse schede grafiche della vecchia configurazione, quindi penso che sia sicuro ragionare che non erano la causa del problema.


la prima parola che viene in mente è calore ... come stai mantenendo il sistema freddo?
James Mertz,

@KronoS: ho modificato la mia domanda per includere la situazione di raffreddamento. Si noti che non sto utilizzando alcun software di monitoraggio della temperatura della CPU.
Scott Mitchell,

2
Devi installare SpeedFan e farci sapere le
temp

@studiohack: Grazie per il suggerimento: ho scaricato e installato SpeedFan e modificato la mia domanda per includere queste nuove letture. Queste letture della temperatura sono normali?
Scott Mitchell,

2
@Scott Scarica 3dMark '06 e FurMark lasciarlo funzionare per un paio d'ore. Segnala eventuali arresti anomali. In caso di arresto anomalo, utilizzare solo 1 scheda video alla volta
Sathyajith Bhat

Risposte:


11

A giudicare da ciò che hai pubblicato e dal raffreddamento, il tuo computer si sta surriscaldando ed è la prima cosa da correggere. 64 C su un carico inattivo non è accettabile e non è davvero preferito a pieno carico. Sono un po 'paranoico e impazzisco ogni volta che la mia CPU supera i 35, ma in realtà 50 dovrebbero essere il massimo su un carico.

Investi in una buona soluzione di raffreddamento per il tuo sistema. Un sistema abbastanza decente ti riporterà da 20 a 30 dollari. Se stai cercando un aiuto su cosa cercare, dai un'occhiata a questa recensione di Tom's Hardware su soluzioni di raffreddamento inferiori a $ 40.

Inoltre potresti voler abilitare la tua schermata blu della morte (per quanto terribile possa sembrare) in modo da poter eseguire il debug dei blocchi problematici. Questo viene fatto da:

-> facendo clic con il tasto destro su "Computer" dal menu Start

-> Seleziona "Proprietà"

-> Seleziona "Impostazioni di sistema avanzate"

-> Seleziona la scheda "Avanzate"

-> Seleziona "Avvio e ripristino"

-> Assicurarsi che "Scrivi un evento nel registro di sistema" sia abilitato.

A volte ci sono detergenti che interrompono automaticamente la registrazione di BSOD ( Advanced System Care ) e potresti voler cercare di impedirlo. Dopo aver verificato questo problema, ti suggerisco di utilizzare BlueScreenView di NirSoft per visualizzare i dettagli dell'arresto anomalo / problemi relativi al debug.

Infine, vorrei controllare e ricontrollare il tuo PC e TUTTE le tue connessioni. In realtà ho avuto una situazione simile e ho scoperto che uno dei cavi USB della scheda madre interna era collegato in modo errato, causando così problemi.

Aggiornare

Ho messo insieme alcune domande per la risoluzione generale dei problemi e la diagnosi di arresti anomali o blocchi. Si prega di fare riferimento anche a loro, poiché possono anche aiutarti nella ricerca del problema.


@KronoS: hai qualche sistema di raffreddamento raccomandato che desideri condividere?
Scott Mitchell,

@ScottMitchell ... risposta aggiornata. Consiglio vivamente di fare la tua ricerca anche se la situazione di ciascun Super User è diversa.
James Mertz,

3
@ScottMitchell Consiglierei di cambiare il materiale dell'interfaccia termica (TIM aka pasta termica) prima di aggiungere qualsiasi raffreddamento esterno. Inoltre, controllare la presenza di polvere sulla ventola / griglie / prese d'aria e rimuoverle usando un getto di aria compressa.
Sathyajith Bhat

@Sathya: grazie per il suggerimento. Ho risolto il caso la scorsa settimana e ho fatto funzionare il computer per un giorno con un caso aperto e le temperature sono scese negli anni '40. Questa mattina ho ispezionato il sistema di raffreddamento esistente della CPU e ho notato molta polvere che copriva le griglie sotto la ventola, quindi le ho pulite. Rimetto il caso e vedremo se le temperature rimangono basse e se ciò aiuta a prevenire i congelamenti futuri. (Se è così, lo segnerò come risposta ...)
Scott Mitchell il

@Scott Ah felice di sentirci, tienici aggiornati.
Sathyajith Bhat

5

I blocchi del sistema rigido (in cui non è possibile utilizzare tasti di scelta rapida come CTRL + ALT + CANC) sono causati da driver sospesi,
quindi sarà necessario sostituire il dispositivo o aggiornare il driver. La risoluzione dei problemi può essere eseguita:

  1. Scarica l'installazione da Strumenti di analisi delle prestazioni di Windows per la tua versione di Windows.
  2. Installa il software sul tuo sistema.
  3. Apri un prompt dei comandi come amministratore e copia incolla il comando successivo:

    xperf -start perf!GeneralProfiles.InBuffer && timeout -1 && xperf -stop perf!GeneralProfiles.InBuffer myTrace.etl
    
  4. Premi ENTER una volta per avviare il comando, ora dovrai attendere che il sistema si blocchi.
    Puoi fare quello che vuoi. Per favore, niente attività pesanti come giochi o cose private ...

  5. Subito dopo che il sistema smette di bloccarsi , vai alla console e premi ENTER.
  6. Dopo aver atteso qualche tempo verrà prodotto un file di registro myTrace.etl, comprimilo in un file zip.
  7. Metti questa versione compressa del file da qualche parte online (forse 2shared).
  8. Condividi qui il link, cercherò di trovare e mostrarti la causa del tuo problema.

11
Domanda relativa a: passaggio 5: cosa devo fare se il sistema non si blocca mai fino a quando non riavvio la macchina?
Scott Mitchell,


4

Se sono trascorsi un paio d'anni dalla costruzione del computer, una pulizia accurata sarebbe un buon modo di agire. Rimuovere tutta la polvere dalle ventole, dai dissipatori di calore, dalle schede e dagli angoli. Le parti più importanti sono i dissipatori di calore e le ventole della CPU. L'aria compressa è buona per questo scopo, ma a lungo termine un aspirapolvere può essere più sano. Farlo accuratamente ridurrà notevolmente la ventilazione e ridurrà il calore.

Il calore non avrebbe dovuto essere un problema con un nuovo computer, a meno che non fosse tenuto in una stanza (o armadio) molto calda e scarsamente ventilata. I produttori di CPU prevedono che i loro prodotti vengano utilizzati in condizioni variabili e persino il dissipatore di calore e la ventola di serie sono realizzati per consentire al prodotto di funzionare nella maggior parte dei casi.

Dal momento che hai avuto i problemi da quando l'hai costruito, tendo a inclinarmi verso un guasto in uno dei componenti. Sulla base dei problemi descritti, mi sto appoggiando a una scheda madre difettosa, basandomi solo sulla mia esperienza.


1
Come ho notato nella mia domanda, questo problema di congelamento si è verificato con una certa regolarità da quando ho costruito il computer. Purtroppo, non è un evento recente.
Scott Mitchell,

corretta. ed è per questo che mi rivolgo a un apparecchio difettoso piuttosto che al calore, poiché il calore non avrebbe dovuto essere un problema quando lo hai costruito per la prima volta (a meno che non tieni dove il computer è molto caldo all'inizio)
Xantec il

Il calore avrebbe potuto essere un problema al momento della creazione del sistema. Una volta abbiamo ricevuto una workstation a doppio processore da un importante produttore con le ventole del processore collegate ai pin della ventola della scheda madre dell'altro processore. ... Ma probabilmente non il problema in questo caso.
Mike Chess,

1

Ho attraversato questo processo l'anno scorso.

La prima cosa è determinare se si tratta di hardware o software. Ciò significa eseguire su di esso due diversi sistemi operativi. Nel mio caso, la mia installazione principale era Linux, e si bloccava a caso - simile a quello che descrivi. A volte ogni 5 minuti, altre volte andrebbe per diversi giorni.

Alla fine ho installato Windows, che ha riscontrato gli stessi problemi. Quando ho riavviato e si è bloccato durante il post, ho restituito l'MB e da allora non ho più avuto problemi.

Come parte del processo di debug, ho anche provato diversi driver video: i driver generici e non accelerati non si bloccavano spesso. Ho anche installato temp. utilità di monitoraggio e revisioni dei log per vedere se c'era qualcosa di comune prima del congelamento. Dato che era hardware e apparentemente casuale, non ho mai trovato alcun modo per causare il problema in modo affidabile, ma questo dovrebbe essere il tuo obiettivo.


Non sono esattamente sicuro di cosa stai suggerendo qui?
James Mertz,

Se si tratta di un problema con l'hardware, il problema sarà presente indipendentemente dal sistema operativo. Se viene visualizzato solo con un sistema operativo e non con un altro, è molto probabile che sia un software.
chris,

1
@chris: il problema è stato risolto da quando ho creato il computer. Inizialmente stavo usando Windows Server 2003, successivamente ho eseguito l'aggiornamento a Windows 7. Con entrambi i sistemi operativi ho riscontrato questi blocchi / blocchi.
Scott Mitchell,

@Scott - Stai monitorando anche le temperature della GPU? Se più sistemi operativi presentano lo stesso problema, mi spingerei verso l'hardware, anche se immagino che entrambi stiano usando lo stesso driver video. Hai provato a rimuovere una delle schede video e vedi se riesci a restringerla a una scheda specifica?
chris,

1
Bene, se si presume che non siano le schede video, allora lascia memoria, scheda madre o software. Se si esclude il software a causa della visualizzazione del problema con Win7 e Win2003 (che non vorrei) che lascia memoria o MB. Puoi scambiare la RAM?
chris,

1

Sospetterei prima l'alimentatore. Prova a sostituirlo con un'unità di potenza superiore e vedi se le cose diventano più stabili. È possibile che le barre di tensione si stiano abbassando un po 'sotto carico, il che spiega perché viene visualizzato più frequentemente con la riproduzione video.

Per testare questa teoria, avrai bisogno di un voltmetro accurato e di alcune abilità elettriche di base, ma dato quanto sia utile un alimentatore di riserva sarei tentato di scambiarlo e vedere.


1

Sulla base dell'aggiornamento n. 3 e di un blocco a 38 ° C, il calore di mobo / cpu non è la causa principale. Supponendo che tu abbia solo le schede video aggiunte e nessuna altra scheda aggiuntiva (una volta ho avuto un bel fare questo!), Faccio questi consigli in ordine di ciò che credo sia molto probabilmente la causa:

  • Sostituire le schede video con un'altra scheda valida nota per la risoluzione dei problemi. Comprane uno, prendine uno in prestito - qualunque cosa. Se il problema persiste, passa al punto successivo.

  • Hai menzionato l'aggiornamento del driver della scheda video, ma nessun altro. Assicurarsi che tutti i driver possibili siano effettivamente aggiornati. Una volta ho avuto una bella carta e tutto quello che dovevo fare per sistemare era aggiornare il driver.

  • Se in effetti non hai altre schede aggiuntive (se lo fai, rimuovile ora), disabilita tutte le attrezzature opzionali nel BIOS. Con questo intendo il tuo suono integrato, lan ed estrarre tutti gli elementi USB. Quindi, vedi se va via.

Esco da un arto e dico che sono sicuro al 90% che verrà risolto facendo il proiettile n. 1.



0

Sembra che l'hardware o i driver siano il problema qui. Anche se sarei appoggiato all'hardware poiché hai avuto due diversi sistemi operativi sul computer.

Lavorare su tale presupposto quindi iniziare con le cose più semplici. Ho visto che hai eseguito Memtest e, sebbene sia fantastico, non esclude necessariamente la memoria come sospetta. Quindi prova quanto segue: elimina tutto tranne uno stick di memoria e vedi se ottieni un blocco. Se funziona bene per un po ', inseriscine uno in più e così via fino a quando non ottieni nuovamente il problema. Se si blocca ancora, prova un altro stick in uno slot diverso. Se continua a bloccarsi, passare ad altri componenti hardware.

Alcune persone hanno menzionato il tentativo di sostituire la scheda video e sono d'accordo. Comprane uno economico o prendilo in prestito da un amico e provalo. Fai lo stesso con un alimentatore. Il tuo alimentatore sembra decente, ma vanno male e vale la pena scambiarlo e vedere se questo risolve il problema.

Se tutto ciò fallisce, direi di sostituire la scheda madre. Soprattutto da quando hai detto che hai avuto il problema da quando hai preso il computer per la prima volta.

Un'ultima cosa da controllare solo per essere al sicuro. Esegui un test chkdsk / SMART sui tuoi dischi rigidi. Probabilmente stanno bene ma vale comunque la pena controllarli.


0

Dalla tua descrizione sembra che il problema sia sulla scheda madre. È possibile che il tuo Northbridge abbia un problema ( diagramma della scheda madre ). Ciò che vorrei controllare è anche la configurazione del BIOS per il generatore di clock e la velocità della CPU. (Non conosco la tua scheda madre ma forse ha alcune funzionalità di overclock.) Forse i problemi si verificano sempre quando c'è un carico elevato e la CPU prova a funzionare più velocemente.


0

Sto andando su un'ala qui e suggerendo che il colpevole sia un condensatore bruciato che non è in grado di fornire una carica elettrica per attenuare gli errori di fluttuazione della corrente. Immagino che una fluttuazione abbastanza significativa provocherà il congelamento del sistema, ma rimarrà acceso.

In base all'esperienza passata, darei la colpa a un condensatore bruciato nel tuo alimentatore (PSU), ma suggerirei di controllare tutti i condensatori nel tuo computer, dentro e intorno alla scheda madre, in particolare intorno al ponte nord. Se hai overclocking, è probabile che la scheda madre sia stata fritta. Anche se è improbabile che qualche condensatore abbia bruciato sotto i dissipatori di calore, questa potrebbe anche essere una possibilità.

Se non trovi nulla bruciato sulla scheda madre, garantirei il tuo PSU poiché alcuni hanno una lunga garanzia - il mio 7 anni - quindi non aprirlo per ispezionarlo a meno che tu non sappia che non sei fuori garanzia. Un alimentatore decente può essere riparabile con gli strumenti giusti se è solo un condensatore.


-1

Ho gestito molte situazioni come questa e il problema più comune che ho riscontrato con blocchi o congelamenti era la pasta del dissipatore di calore. La tua ventola può fare quello che vuole, ma se è consentito uno spazio tra il dissipatore di calore e la CPU, il dissipatore di calore non raffredderà l'aria tra i due. Se quella pasta è troppo prosciugata o in luoghi in cui non dovrebbe essere o non è sufficiente o non consente una connessione di calore conduttiva tra il processore e il lavandino, si bloccherà perché sta attivando un circuito di protezione del processore nel processore stesso . Fallo cinque o sei volte fino a quando il problema non scompare. Alla fine lo farà, o butteremo via il tuo processore e ti invieremo uno nuovo senza nemmeno dirtelo. Non vogliamo sostituire la tua CPU. Lo facciamo 10 volte prima di farlo.


1
Posso credere che potresti sapere di cosa stai parlando, ma non riesco a capire cosa stai dicendo. Si prega di modificare la risposta per chiarire - io ti ho dato un inizio. Ad esempio: "Fallo cinque o sei volte ..." - fai cosa? "Lo facciamo 10 volte ..." –– cosa, e chi siamo "noi"? Inoltre, chiarisci cosa stai dicendo che Sathya ♦ non ha già detto nel suo commento del 10 dic 2010 alle 21:36 .
Scott,

-1

Potrebbe essere un problema del driver - ogni volta che sta per gestire il tuo video, molto probabilmente si bloccherà (potrebbe anche fare un rumore strano) perché lo schermo si blocca - la CPU potrebbe ancora funzionare - in effetti tutto potrebbe funzionare - potresti semplicemente non essere in grado di vedere i risultati delle manipolazioni del mouse / della tastiera, perché una volta che il driver si arresta in modo anomalo non c'è nulla che gestisca le rappresentazioni visive degli input.

Soluzione potenziale: aggiorna il driver, se è stato avviato quando hai aggiornato un driver, ripristina il driver precedente, se la tua scheda grafica è vecchia - prova ad acquistarne una nuova - a volte quando le vecchie schede sono patchate con nuovi driver potrebbero essere difettose.

Il surriscaldamento è davvero un problema solo quando la tua carta funziona al 110% della sua potenza prodotta può causare un incidente, ma di nuovo SE solo tu l'hai potenziata molto.


Questa è un'ipotesi, anche se decente. Ma potrebbe anche essere potenza, guasto di un singolo componente, riscaldamento da qualche parte oltre alla CPU (GPU, disco rigido) Potrebbe anche essere solo una cattiva installazione.
Austin T, francese,

-2

Concordo con Nori sull'esecuzione di un test SMART. Utilizzare (la versione gratuita) HDTune per copiare gli attributi SMART. Esegui anche una scansione degli errori. Un singolo settore danneggiato può causare i problemi che stai descrivendo. Il surriscaldamento di solito provoca BSOD e un riavvio forzato o l'arresto. Dal momento che si sta "congelando", mi sembra più un problema con il disco rigido (anche se i dischi rigidi difettosi possono causare anche BSOD).

Controllare lo stato SMART e annotare i dati "Conteggio ore di accensione". Se il conteggio non aumenta dopo alcune ore, gli attributi SMART sono probabilmente bloccati e forniscono uno stato "OK" falso.

Controlla anche i log degli eventi di sistema e dell'applicazione di Windows per errori.

(pannello di controllo -> Strumenti di amministrazione -> Gestione computer -> Visualizzatore eventi)

Assicurati di avere il backup di tutti i tuoi dati importanti.


I problemi del disco peggiorano quasi sempre nel tempo, il che non è il caso della descrizione.
Flotsam N. Jetsam,

@Flotsam Un buon punto. Un disco rigido traballante probabilmente sarebbe morto dopo alcuni anni. Forse un controller RAID traballante allora. I registri degli eventi potrebbero comunque fornire alcuni buoni suggerimenti.
James T,

Consiglio non terribile, ma non sul posto per questa configurazione e i sintomi descritti.
Ярослав Рахматуллин
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.