In Prime95, perché i piccoli FFT generano più calore, nonostante la CPU al 100% per tutte le opzioni?


9

Ho appena costruito un nuovo PC Skylake e vedrò un po 'di overclocking con Prime95 come tester di stress.

Funziona bene nell'uso normale, ma con Prime95 noto un po 'di limitazione della CPU sotto determinati carichi.

Se tutti e 4 i core (8 thread) sono bloccati al 100%, a prescindere, perché l'impostazione Small FFT in Prime95 raggiunge una temperatura superiore rispetto all'opzione "Miscela"?

Risposte:


13

Il codice vettoriale, in particolare AVX, aumenta naturalmente la potenza termica della CPU perché il processore deve funzionare a una tensione più elevata per eseguire queste istruzioni. I piccoli FFT richiedono meno memoria rispetto alla modalità di fusione, quindi il processore impiega più tempo a elaborare i dati e meno tempo in attesa dei dati.

  • L'architettura x86-64 offre ampie capacità di elaborazione vettoriale , in particolare sui processori più recenti. L'elaborazione vettoriale consente alle applicazioni di eseguire operazioni matematiche su più elementi di dati contemporaneamente e viene utilizzata da molte nuove applicazioni ad alta intensità computazionale per aumentare la velocità di elaborazione.

  • Il codice vettorializzato, in particolare le istruzioni AVX utilizzate da Prime95, richiede che il processore funzioni a una tensione superiore al normale. Ciò si traduce in un consumo di energia e una produzione di calore maggiori rispetto a quanto avviene nei normali carichi di lavoro. Per questo motivo, Intel avverte che carichi pesanti AVX possono causare il throttling del processore o non sostenere le frequenze di clock Turbo Boost complete (nota 1):

    Le estensioni Intel® Advanced Vector (Intel® AVX) sono progettate per ottenere un throughput più elevato per determinate operazioni su numeri interi e virgola mobile. A causa delle diverse caratteristiche di potenza del processore, l'utilizzo delle istruzioni AVX può far sì che a) alcune parti funzionino a meno della frequenza nominale eb) alcune parti con tecnologia Intel® Turbo Boost 2.0 per non raggiungere nessuna o massima frequenza turbo.

    Intel lo spiega in modo più dettagliato in questo white paper . In particolare, nota:

    Intel AVX è progettato per ottenere un throughput più elevato per determinate operazioni di numeri interi e in virgola mobile. L'uso di queste istruzioni può far funzionare i processori a una frequenza TDP inferiore. Queste riduzioni di frequenza si verificano perché le istruzioni Intel AVX ad alta potenza richiedono tensione e corrente elettrica aggiuntive.

    • La mia ipotesi sul motivo per cui è necessario potenziare il core V per le istruzioni AVX è che le unità di esecuzione AVX sono più complesse rispetto alle altre parti del processore, determinando fasi di pipeline corrispondenti che richiedono più tempo per il completamento (vedere questa risposta per ulteriori informazioni tecniche sulle pipeline e altri aspetti della progettazione del processore). Se un determinato stadio della pipeline è lento, la frequenza di clock massima dell'intero processore è limitata poiché ogni fase della pipeline deve terminare in ciascun ciclo di clock.

    • Per lo stesso motivo tensioni più elevate aumentano le frequenze massime ottenibili durante l'overclocking (i transistor possono passare più velocemente a tensioni più elevate), l'aumento della tensione aiuta a garantire che gli stadi più lunghi della tubazione possano finire in tempo.

  • La modalità Small FFT utilizza solo elementi di dati più piccoli che possono adattarsi alla cache della CPU , a differenza della modalità di fusione che opera su valori sia piccoli che grandi che potrebbero non rientrare nella cache. Poiché l'accesso alla memoria è lento rispetto alla semplice elaborazione dei dati, il processore impiegherà meno tempo a elaborare i dati in modalità Blend, riducendo la produzione di calore. I piccoli FFT non comportano alcuno vicino a altrettanti accessi alla memoria, con il risultato di un lavoro più effettivo per l'esecuzione della CPU, aumentando così il consumo di energia e la produzione di calore.


Grazie a @DragonLord, questo rende le diverse modalità Prime95 molto chiare. Amplificare la risposta per spiegare perché il monitor delle risorse legge il 100% in entrambi i casi? Perché non legge meno del 100% in modalità Miscela, ad esempio, se è in attesa di dati più del tempo rispetto alla modalità Piccola FFT?
ChrisA

1
La CPU occupata in attesa di memoria viene comunque segnalata come occupata al sistema operativo, a quanto ho capito.
bwDraco,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.