Come posso risolvere quando non ho idea di dove iniziare?


40

Sto cercando suggerimenti, suggerimenti e risposte su come iniziare a risolvere i problemi quando:

  1. Il problema è intermittente
  2. Il problema potrebbe trovarsi letteralmente ovunque: il sistema operativo; software gratuito; i miei sviluppi software; software acquistato; briciole sulla tastiera; la combinazione specifica di software che sto attualmente eseguendo; Il demone di Maxwell; i piccoli uomini blu che gestiscono effettivamente la macchina sono andati in sciopero; eccetera.
  3. Ho esperienza solo in alcune delle aree che sono potenziali candidati per la causa del problema.

Il problema specifico che sto riscontrando è dettagliato di seguito come esempio, ma non cerco risposte al mio problema attuale, ma piuttosto da dove e come iniziare ad affrontare tali problemi.

Attualmente sto riscontrando un problema con la mia nuova macchina. In alcune occasioni la macchina si è appena congelata; non accettare sequenze di tasti, clic del mouse o altro, tranne l'interruttore di accensione / spegnimento. Invariabilmente ho semplicemente navigato sul web; Ho avuto alcune (<= 6 altre applicazioni) in esecuzione. Nessuna di queste applicazioni è importante; e rappresentano un mix di programmi commerciali e programmi open source, tipicamente migrati da Unix di una certa varietà.

La mia macchina è un laptop quad-core I7 con Windows 7.

MODIFICARE:

Anche se ho affermato che l'attuale descrizione del problema era solo un esempio, alcuni dei commenti si stanno concentrando sulla risoluzione di questo problema. Sfortunatamente, dato che era solo un esempio, le informazioni fornite sono corrette ma non complete. Per evitare che le persone perdano tempo a cercare, in remoto, di aiutare con il problema reale, sto fornendo alcune altre informazioni sulla mia configurazione. Come ho detto inizialmente, non cerco risposte a questo specifico problema.

La mia macchina è un laptop ad alta potenza; è la mia macchina principale; viene utilizzato per lo sviluppo e la scrittura tecnica, le comunicazioni - e-mail, web, FTP, ecc. e per il fotoritocco e l'indicizzazione. Una suite rigorosa ed estesa di programmi di test hardware, inclusi test CPU, test di memoria multipla e test su tutti gli altri componenti, viene eseguita su di esso almeno mensilmente. Esegui anche almeno mensilmente una scansione antivirus completa; una scansione spyware completa; una pulizia del disco; e una deframmentazione del disco.

Il disco contiene circa 3 * 10 ^ 6 file; l'utilizzo del disco è di 300 GB lasciando 150 GB liberi. La memoria è di 8 GB. Mentre la macchina può riscaldarsi leggermente quando eseguo una serie completa dei principali strumenti di sviluppo, ho riscontrato il problema solo quando utilizzo la macchina in modo molto leggero: navigazione Web, Textpad, Graphviz, database Firebird e browser leggero (Flame Robin ). In queste circostanze, anche la ventola non è leggermente calda. Non ho apportato modifiche al software, al sistema operativo o all'hardware nel periodo in cui ho riscontrato il problema. Si sono verificati numerosi aggiornamenti automatici: principalmente Microsoft, Adobe e Lenovo, ma non esclusivamente.

Questo background mette in contesto (spero) le mie ragioni per porre questa domanda come ho fatto io. Ora inizierò a indagare sui vari registri menzionati nelle risposte come primo passo nel tentativo di restringere il campo di indagine. E proverò un esercizio una delle caratteristiche suggerite nelle risposte che ho ricevuto finora - la pazienza - nelle mie indagini.


6
+1 Perché questa domanda può essere utile per collegarmi in futuro.
Tamara Wijsman,

2
A volte, prima di lanciarsi in un approccio metodico e completo di risoluzione dei problemi, dovresti provare a spazzare via i frutti comuni a bassa quota: esegui una scansione spyware completa, cerca nel registro di Windows gli arresti imprevisti e vedi quali (se presenti) problemi l'hanno preceduto, controlla la situazione dello spazio su disco, esegui check disk, dai agli Autoruns di Sysinternal una rapida scansione per software sconosciuto / sospetto. Avere un semplice set di strumenti da eseguire che può identificare rapidamente una grande varietà di problemi hardware e software. Se non trovano nulla, hai perso poco tempo e puoi iniziare un processo più approfondito.
Alain,

1
Inoltre, segui il Blog di Mark per esempi di come i problemi fastidiosi vengono risolti con Sysinternals.
Tamara Wijsman,

1
Buona fortuna per la risoluzione dei problemi, suggerirei di creare una nuova domanda se desideri più feedback per mantenere le cose organizzate ...
Tamara Wijsman

Risposte:


42

Ottieni un'idea migliore.

Non vincerai una battaglia senza sufficienti informazioni sul campo.

  1. Descrivi il tuo problema in dettaglio in modo da averne una buona idea, chissà che accada solo una volta.

  2. Traccia indietro nel tempo ciò che è accaduto prima e insieme al problema, sia tu che il tuo computer.

  3. Pensa alle possibili cause perché a volte potrebbe essere qualcosa che non è ovvio.

  4. Ottieni maggiori informazioni ogni volta che non hai idea di cosa stia accadendo, questo può variare da Eventi , a SysInternals Tools , a Performance Analysis , a Debugging , a qualsiasi altro strumento di tua competenza .

  5. Metti alla prova le tue ipotesi per essere sicuro che i tuoi pensieri non filtrino la causa.

Dividere e conquistare.

Perché è così che i militari sconfiggono il loro avversario anche quando sono più numerosi.

Elimina le possibili cause o avrai un problema a tenerne traccia. In questo modo, ti avvicinerai sempre più alla causa principale del problema, ti consentirà di risolvere il problema molto più facilmente.

Ad esempio, con l'hardware , scollegare e rimuovere tutto ciò che non è necessario per risolvere il problema. In questo modo, è possibile disconnettere il componente che causa il problema. E poi di nuovo si tratta di inserire metà dei componenti, controllare se si ripresenta e ripetere la divisione fino a quando non si ha il componente difettoso ...

Testare qualcosa su un altro computer, se disponibile, è anche un buon vantaggio per risolvere il problema.

Ad esempio, con il software , anche il riavvio in modalità provvisoria, la disabilitazione delle voci di avvio aiuta. Questo vale anche per abilitare / disabilitare le impostazioni, provare la configurazione predefinita e così via ...

Mettiamolo alla prova.

Attualmente sto riscontrando un problema con la mia nuova macchina. In alcune occasioni la macchina si è appena congelata; non accettare sequenze di tasti, clic del mouse o altro, tranne l'interruttore di accensione / spegnimento. Invariabilmente ho semplicemente navigato sul web; Ho avuto alcune (<= 6 altre applicazioni) in esecuzione. Nessuna di queste applicazioni è importante; e rappresentano un mix di programmi commerciali e programmi open source, tipicamente migrati da Unix di una certa varietà.

  1. Questa è una descrizione corretta da sola, non succede neanche una volta .

  2. Sai cosa è successo insieme al problema,
    ma non hai pensato a cose che tu o il tuo computer avete fatto prima del problema .

    Non posso dirlo, ma tu, il tuo registro eventi e i file / le cartelle modificati di recente potresti dirlo.

  3. È probabile che la causa probabile sia correlata alla CPU , perché è il componente che elabora le cose.

    Più specifico potrebbe essere un processo, un driver o un hardware guasto (forse problemi di temperatura?).

  4. So che è CPU, ma non so cosa. Gli eventi non lo mostrano, Process Explorer si bloccherebbe su DPC .

    Quindi, passo successivo, lascio eseguire l'analisi della traccia che chiudo dopo che si è verificato l'hang.

    Guardo la traccia e vedo che il driver X sta causando il problema !

  5. Non vengono fatte ipotesi reali. L'assunto della CPU è gestito dal nostro approccio Divide & Conquer ...

Quindi, è qui che inizio a dividermi per conquistare il problema, una volta risolto mi fermo:

  1. Problemi con la versione corrente del driver?
    Aggiorna il driver all'ultima versione.

  2. Problemi con le versioni più recenti del driver?
    Ottieni una nuova traccia. Aggiorna il driver a una versione precedente diversa dall'iniziale.

  3. Problemi con il dispositivo? Problemi di configurazione nel registro?
    Ottieni una nuova traccia. Reinstallare e / o disabilitare il dispositivo, se possibile.

  4. Il problema è casuale, il processore si sta riscaldando?
    Controllare la temperatura del processore, sostituire la ventola se necessario.

  5. Il problema non è il processore, ci sono altre influenze hardware e software?
    Rimuovi l'hardware e disabilita l'esecuzione del software, per inchiodare l'influenza di terzi.

  6. Il problema non è in una parte rimovibile, dovrebbe essere sostituito.
    Nel peggiore dei casi, se tutto il resto fallisce, è necessario richiedere una sostituzione.

Ottenere nuove tracce e rimuovere l'hardware ci dà più informazioni, quindi sappiamo dove guardare dopo.


4
+1 per dividere e conquistare. Accettato per la specifica di descrizione, tracking back e meccanismi per dividere e superare il problema.
Chris Walton,

5
+1 risposta brillante. L'unica cosa da aggiungere è questa: metti alla prova le tue ipotesi
Bevan,

che ne dici di "cambiare una cosa alla volta"?
Florenz Kley,

2
@Florenz: Beh, dividendoli o li prendi uno per uno (per un piccolo numero o quando non puoi basarti su più cause) o li dividi (per un numero più grande, quando puoi controllare più cose su una volta, dividere a metà, se possibile, è più veloce che eseguirli uno per uno. Ad esempio, per risolvere 100 cose devi solo testarlo 8 volte (100-> 50-> 25-> 13-> 7-> 4-> 2-> 1), invece di 100 volte ...
Tamara Wijsman

2
divisione sensata! Quello che intendevo dire è "non aggiustare le cose più velocemente di quanto tu possa attribuire una modifica a un delta osservato". L'uso di un libro di laboratorio con pagine che non riesco a strappare è il mio metodo per assicurarmi di poterlo fare.
Florenz Kley,

6

Buoni registri e intuizione - davvero.

  • Dal primo giorno, tieni traccia di tutto ciò che fai al sistema: aggiornamenti di app e SO, nuove installazioni, hardware o connessioni nuovi o rimossi, il temporale che "non ha causato problemi".
  • Quando hai notato il problema per la prima volta:
    • Che cosa stavi facendo?
    • Che altro insolito è successo di recente?
    • Che cosa hai fatto diversamente di recente?
    • Da quel momento in poi, tieni presente ciò che stai facendo, quindi la prossima volta che capisci, hai una migliore comprensione di ciò che l'aveva appena preceduto.
    • Snapshot i registri di sistema.
  • Vedi se riesci a riprodurlo. Fino a quando non puoi riprodurlo, non riesci a trovarlo.
  • Inizia a partizionare il sistema: modalità provvisoria vs. esecuzione live, nuovo account rispetto al tuo account normale, tastiera e mouse diversi rispetto a quelli normali (specialmente bluetooth vs. cablato), succede entro pochi minuti dall'inizio o dal risveglio vs. solo dopo un'ora di corsa in più (pensa al termico).

2
+1 per l'attività di registrazione; e per intuizione. Non è la risposta accettata solo perché la registrazione è buona solo se eseguita dal primo giorno. Ho tenuto i registri ma non sono sufficientemente dettagliato; e non hanno incluso aggiornamenti di sistema di Microsoft e altri aggiornamenti automatici.
Chris Walton,

1
@ChrisWalton: sono disponibili registri dettagliati per Windows Update, inserimento / rimozione dei dispositivi, installazione dei driver e così via. Vedere C:\Windows\*.log, C:\Windows\Logs, C:\Windows\inf\*.loge anche Performance Monitor > Data Collector Sets > (Startup) Event Trace Sessions. Inoltre, @JRobert, +1 per aver spiegato come avere un'idea in modo più dettagliato ...
Tamara Wijsman

4

Di solito inizio con i registri eventi e tutti i registri che un programma può creare da solo. I programmi a volte creano un registro nella cartella del programma.

Dopo aver identificato l'ora, cerca nel registro gli eventi. Naturalmente i registri di Windows possono presentare errori di Stop che saranno facili da identificare.

Controlla tutti i driver e assicurati che siano aggiornati.

È probabile che la pazienza sia richiesta in grandi dosi.


2

Oltre a tutti i buoni consigli già forniti, se i file di registro non ti danno molto da fare, spesso è utile un corretto test della memoria della macchina: una memoria difettosa può causare tutti i tipi di strani blocchi e arresti intermittenti. Il test di memoria integrato è molto più simile a un conteggio della memoria, è estremamente raro che il test di accensione rilevi un errore di memoria.

Diagnostica memoria di Google per Windows e masterizzala su un CD. È vecchio ma è uno dei migliori test di memoria ed è gratuito.


grazie per la risposta e lo strumento suggerito. Temo che abbiate perso il punto della mia domanda: suggerite test di memoria; qualcun altro ha suggerito download automatici di software Adobe. La mia domanda era; in queste circostanze come decidi cosa fare quando ci sono molte possibilità.
Chris Walton,

1
@ Chris: Come ho detto; quando si risolvono problemi intermittenti e inspiegabili (in una situazione di sviluppo senza sw ofcourse), se non ci sono registri da cui partire e nessun altro indicatore che suggerisca da dove iniziare, eseguirei un test di memoria. Essendo la logica, è relativamente veloce da eseguire rispetto al tentativo di replicare un problema intermittente. Una volta escluso, inizia il restringimento e ottieni un'idea mentre TomWij la mette.
Matt

giusto.
Chris Walton,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.