Nvidia K20X vs GeForce Titan per accelerazione GPGPU


10

Sto cercando di capire la differenza tra queste due schede grafiche per il calcolo accademico, in particolare per il componente DGEMM.

Se osserviamo le statistiche grezze, entrambe hanno lo stesso chip GK110, statistiche comparabili praticamente in ogni categoria e, credo, hanno la stessa architettura di base. Prima di qualsiasi sconto, il K20X è circa il doppio del costo di un Titano. Dal punto di vista dell'efficienza sembra avere molto senso usare Titan su K20X.

Sto avendo difficoltà a capire la differenza qui, qualcuno può illuminare la situazione?

Come nota, sto cercando di acquistare queste carte per un server rack e correre alla massima inclinazione essenzialmente finché non muoiono; tuttavia, non vedo l'efficienza dell'utilizzo di più GPU per un singolo lavoro particolarmente importante.

Risposte:


13

Ci sono alcune differenze, tuttavia non sono necessariamente in hardware o specifiche. Nota che queste sono tutte le informazioni che ho guadagnato dai forum o dai comunicati stampa, quindi prendi tutto con un pizzico di sale.

Il primo è la "scalabilità e affidabilità" ( fonte ). Il K20 è stato progettato per sedersi in un sistema a cluster e funzionare alla massima inclinazione 24/7. Titan è più progettato per i giochi, quindi verrà eseguito in questo ciclo di lavoro, ma potrebbe essere soggetto a problemi di lunga durata se utilizzato in questo modo.

Anche i driver sono diversi, tuttavia non sono sicuro delle differenze principali. La differenza di messa a fuoco del design delle carte probabilmente porta a guadagni di prestazioni relativamente piccoli per le carte Tesla su questo fronte.

"Alcune funzionalità esclusive di Tesla includono:

  • NVIDIA GPUDirect RDMA per prestazioni InfiniBand
  • Hyper-Q per MPI (Hyper-Q per CUDA Streams è supportato su GeForce GTX TITAN)
  • Protezione ECC per tutti i registri e le memorie interne ed esterne
  • Strumenti supportati per GPU e gestione dei cluster, come Bright Computing, Ganglia. "( Fonte )

Ciò indica che la principale differenza è la loro scalabilità. Se stai cercando di correre su un desktop nel tuo ufficio, sarebbe difficile discutere contro un Titano sul K20 per la differenza di prezzo. Se hai bisogno delle prestazioni extra di più K20, trova un centro HPC e guadagna tempo con i loro server.

Modificare:

Dopo aver esaminato un po 'di più ECC, sto aggiornando questa risposta per sottolineare le implicazioni di averlo sul K20 e non su Titan. Le seguenti informazioni sono una parafrasi delle informazioni trovate qui .

ECC esegue il controllo degli errori sulla DRAM e registra la GPU. Gli errori soft si verificano quando un bit viene trasferito / archiviato in modo errato. Più veloci e vicini sono i circuiti, maggiore è la probabilità di un errore soft. Se stai risolvendo un insieme di ODE accoppiati o risolvendo un sistema lineare, un singolo numero che è spento di un bit potrebbe cambiare significativamente i risultati in un modo non riproducibile. La maggior parte della RAM e delle cache standard nella CPU sono controllate per errori per questi errori utilizzando ECC.

D'altra parte, le GPU, in generale, non hanno ECC anche se il loro bus di memoria è molto più veloce di quelli sulla CPU. Questo perché se un pixel sullo schermo viene disattivato di un po 'per un fotogramma, la qualità del programma non viene ridotta. Anche questi errori non propongono. Pertanto, è possibile risparmiare un sacco di proprietà (e costi) dei chip saltando questa funzione. Questa complessità aggiuntiva probabilmente causa una grande parte del costo aggiuntivo della linea Tesla.


3
Ottima risposta +1! È difficile credere che queste funzionalità siano così costose. Penso che la linea "Sviluppa con GeForce, Distribuisci con Tesla" dal sito Nvidia collegato riassuma le questioni importanti. Sembra che la soluzione migliore per ora sia comprare diverse GeForces e farle funzionare fino a quando non rinunciano al fumo blu per così dire.
Ofion,

3
"Questo, tuttavia, non ha impedito loro di essere utilizzati a Oakridge." Di OLCF Cray XK7 denominato "Titan" utilizza Tesla K20 GPU, non la GTX Titan. NVidia afferma che la GTX Titan ha "la tecnologia di" OLCF Titan, che è lo stesso vocabolario usato quando si dice che un'auto economica ha "la tecnologia di" un'auto di Formula 1. (Le prestazioni di GTX Titan sono piuttosto buone, ma non hanno ECC e non sono utilizzate in nessuna delle principali installazioni di cui sono a conoscenza.)
Jed Brown

1
Errore mio, ho frainteso l'articolo. Aggiornerò la risposta per non essere fuorviante.
Godric Seer,

2

A mio avviso, la differenza sembra essere principalmente la segmentazione del mercato. Se sei uno scienziato, NVidia vuole che tu abbia paura che il tuo documento venga rifiutato perché stai usando una GPGPU senza tanto errore nella correzione della RAM che sarebbe disponibile con K20X. Allo stesso modo, se sei una società, potresti voler pagare 4x se ciò significa che hai meno probabilità di essere citato in giudizio con il sospetto che i tuoi calcoli non siano corretti il ​​più possibile. I singoli giocatori o gli appassionati di GPGPU sono venduti a Titano perché hanno meno soldi e sono più difficili da persuadere in questi modi.


2
Ho eseguito solo calcoli con ECC, ti capita di avere un buon articolo che dimostri i fallimenti dei sistemi non ECC e dei punti di interruzione logici dove è vantaggioso?
Ofione,


Per coloro che desiderano il riassunto esecutivo dell'ottimo collegamento di BenC: gli errori soft che ECC risolverebbe sono estremamente rari e il documento arriva fino a raccomandare di disattivare ECC su Tesla per una maggiore velocità. Avvertenza: questo non è stato effettivamente testato con GPU consumer.
semi-estrinseco il

0

Dipende molto dall'applicazione che esegui. GPUGRID.net funziona su macchine che non hanno ECC attivo e tutto va bene. I risultati sono buoni come lo sono su qualsiasi altra piattaforma. Acellera vende anche hardware con schede GeForce e in pochissimi casi le GPU non hanno funzionato. GeForce è tutto ciò di cui hai bisogno.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.