Verifica se la scheda grafica NVIDIA si arresta in modo anomalo a causa di un alimentatore sottodimensionato


2

Ultimamente ho iniziato a giocare a giochi più recenti e ho riscontrato errori di stampa frequenti e intermittenti come DXGI_ERROR_DEVICE_HUNG, DXGI_ERROR_DEVICE_REMOVED, o simili. La ricerca ha ridotto il problema a queste possibilità:

  • scheda grafica difettosa,
  • alimentatore underpowered.

La mia domanda è: come faccio a distinguere tra i due? C'è qualche diagnostica che registra un evento "guasto dovuto a potenza insufficiente" per le schede NVIDIA, o qualcosa del genere?

La scheda si basa su un chipset della serie NVIDIA GTX 6xx e il sistema in questione è Windows 7 a 64 bit (dual boot con Linux, nel caso sia necessario per eseguire la risoluzione dei problemi).


Gli appunti:

Sto deliberatamente omettendo il resto della configurazione, dal momento che mi piacerebbe che la risposta fosse il più generica possibile, a beneficio della comunità. Se pensi di avere una soluzione che è ancora abbastanza generale e assolutamente esigenze qualche informazione in più, lascia un commento.

Underclocking non è una soluzione praticabile (dal momento che non distingue tra le due condizioni) e, in base alle specifiche della scheda e del PSU, il wattaggio fornito dovrebbe essere sufficiente (anche se con un solo overhead stretto).

Per completezza, ecco un grafico dei parametri delle carte subito dopo l'incidente. Ogni etichetta descrive il grafico sottostante, il grafico più in alto è la temperatura in gradi Celsius. Il picco nell'utilizzo della GPU e il calo della frequenza di Core Clock corrispondono a un crash:

Graphics card stats during normal operation and a crash


Per una completezza ancora più completa e per salvare il tempo di tutti: ho provato altre possibili soluzioni, tra cui: regolazione delle impostazioni PhysX, ottimizzazione delle impostazioni di risparmio energetico (sia per la scheda che per il sistema), per aggiornare tutto (sistema operativo, driver della scheda grafica , BIOS della scheda madre, carta grafica BIOS, i giochi stessi), chiudendo tutti gli altri programmi, eseguendo il programma di installazione di DirectX, eseguendo la diagnostica DirectX, reinstallando fisicamente la scheda e, ovviamente, controllando se la scheda grafica si surriscaldava.
mikołak

Risposte:


2

Se usi una PSU senza nome, questa è probabilmente la fonte del tuo problema. Anche se a volte succede con l'alimentatore noto di marca, il no-name generalmente conta tutti i power-line (-5, -12, 3.3, 5, 5VSB, 12V) per il loro wattaggio totale, dove solo il + 12V è realmente usato da una scheda grafica (se ha un connettore di alimentazione esterno) e CPU (con un connettore P4). Inoltre il 3.3 e / o il 5V spesso forniscono corrente ad ampère elevata, mentre il + 12V è inferiore. (già visto un alimentatore con 40A inutili su + 3,3 V e appena 18A su + 12V) L'alimentatore senza nome può anche avere componenti sottodimensionati, rendendoli incapaci di fornire correttamente oltre l'80% della potenza totale.

Conoscere tutte le specifiche hardware del tuo computer ti aiuterà già a sapere se l'alimentatore dovrebbe essere sufficiente o meno.

Una cosa che puoi provare però: blocca il moltiplicatore della CPU ad un valore più basso, sottotitolo in modo da consumare un po 'meno corrente, ma questo non influirà direttamente sulla scheda grafica. Ovviamente otterrai prestazioni inferiori in-game.

Puoi provare lo stesso con il chipset, ma assicurati che la frequenza di collegamento PCIe sia fissa a 100Mhz.

Infine, alcune schede grafiche possiedono un LED incorporato che indica un errore nell'accensione corretta della scheda. (il mio Sapphire Radeon HD4850 ​​ne ha uno per esempio, ma qui stiamo parlando di NVidia)


Ho intenzionalmente omesso gran parte della configurazione, perché preferirei che le risposte fossero il più generiche possibile - vorrei che questo QA fosse utile non solo a me stesso, ma a qualsiasi altro povero zoticone che incontra lo stesso problema;). Per la cronaca, il PSU (e altri componenti) sono marchiati, anche se sfortunatamente la tua richiesta non mi ha affatto sorpreso. L'osservazione a LED è utile, cercherò di cercarne una, grazie.
mikołak

Va bene, come ho detto che dovresti anche cercare di ridurre l'utilizzo della CPU, anche se non farebbe molta differenza, specialmente se non è "potente". E dal momento che stai chiedendo di registrare un evento che indica un PSU non sufficiente, penso che non sarebbe possibile distinguere tra un errore di PSU o un errore nella gestione della potenza della scheda grafica. Ma non sono a conoscenza di un registro di questo tipo. Ma so che alcune schede grafiche (NVidia 6xxx-8xxx o ATi 9xxx) si lamentano al momento dell'avvio quando c'è un problema con l'alimentazione esterna.
piernov

CPU Underclocking riducendo i moltiplicatori di un fattore 4 - accade la stessa cosa. Dato il differenziale del consumo energetico massimo per la CPU e la grafica è di circa 100W (a favore della scheda), purtroppo era prevedibile. Né ho trovato un LED sulla scheda. Nessun reclamo al momento dell'avvio, ma a quel punto il consumo energetico è ben al di sotto del 100%. Quindi, torna al punto di partenza.
mikołak

0

Pertanto, la scheda è stata sostituita in garanzia a causa di un "errore hardware" non specificato.

Per riassumere, se:

  • avete problemi come quelli nella domanda (spegnimento intermittente della scheda senza picchi di temperatura),
  • hai confermato che il tuo alimentatore non è sottodimensionato w.r.t. la tua scheda grafica

Quindi, è sufficiente verificare se l'errore si verifica quando la scheda viene inserita in una configurazione hardware completamente diversa. La macchina che fornisce la verifica dovrebbe avere specifiche uguali o maggiori, ovviamente (specialmente l'alimentatore e la scheda madre).

Alla fine, questo è esattamente quello che ho fatto - ha chiesto ad un amico di controllare la scheda sul proprio computer. Lo stesso errore è comparso in circa 7 minuti.

Certo, c'è un molto possibilità remota che la scheda grafica potrebbe essere difettosa in modo tale da danneggiare la scheda madre - tuttavia, ciò non è molto probabile, e controllare solo la scheda grafica su un'altra configurazione è più sicura rispetto al contrario, dal momento che qui c'è solo un singolo componente difettoso in gioco.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.