Ci sono alcune differenze, tuttavia non sono necessariamente in hardware o specifiche. Nota che queste sono tutte le informazioni che ho guadagnato dai forum o dai comunicati stampa, quindi prendi tutto con un pizzico di sale.
Il primo è la "scalabilità e affidabilità" ( fonte ). Il K20 è stato progettato per sedersi in un sistema a cluster e funzionare alla massima inclinazione 24/7. Titan è più progettato per i giochi, quindi verrà eseguito in questo ciclo di lavoro, ma potrebbe essere soggetto a problemi di lunga durata se utilizzato in questo modo.
Anche i driver sono diversi, tuttavia non sono sicuro delle differenze principali. La differenza di messa a fuoco del design delle carte probabilmente porta a guadagni di prestazioni relativamente piccoli per le carte Tesla su questo fronte.
"Alcune funzionalità esclusive di Tesla includono:
- NVIDIA GPUDirect RDMA per prestazioni InfiniBand
- Hyper-Q per MPI (Hyper-Q per CUDA Streams è supportato su GeForce GTX TITAN)
- Protezione ECC per tutti i registri e le memorie interne ed esterne
- Strumenti supportati per GPU e gestione dei cluster, come Bright Computing, Ganglia. "( Fonte )
Ciò indica che la principale differenza è la loro scalabilità. Se stai cercando di correre su un desktop nel tuo ufficio, sarebbe difficile discutere contro un Titano sul K20 per la differenza di prezzo. Se hai bisogno delle prestazioni extra di più K20, trova un centro HPC e guadagna tempo con i loro server.
Modificare:
Dopo aver esaminato un po 'di più ECC, sto aggiornando questa risposta per sottolineare le implicazioni di averlo sul K20 e non su Titan. Le seguenti informazioni sono una parafrasi delle informazioni trovate qui .
ECC esegue il controllo degli errori sulla DRAM e registra la GPU. Gli errori soft si verificano quando un bit viene trasferito / archiviato in modo errato. Più veloci e vicini sono i circuiti, maggiore è la probabilità di un errore soft. Se stai risolvendo un insieme di ODE accoppiati o risolvendo un sistema lineare, un singolo numero che è spento di un bit potrebbe cambiare significativamente i risultati in un modo non riproducibile. La maggior parte della RAM e delle cache standard nella CPU sono controllate per errori per questi errori utilizzando ECC.
D'altra parte, le GPU, in generale, non hanno ECC anche se il loro bus di memoria è molto più veloce di quelli sulla CPU. Questo perché se un pixel sullo schermo viene disattivato di un po 'per un fotogramma, la qualità del programma non viene ridotta. Anche questi errori non propongono. Pertanto, è possibile risparmiare un sacco di proprietà (e costi) dei chip saltando questa funzione. Questa complessità aggiuntiva probabilmente causa una grande parte del costo aggiuntivo della linea Tesla.