Sto lavorando sul modello Seq2Seq usando LSTM di Keras (usando lo sfondo Theano) e vorrei parallelizzare i processi, perché anche pochi MB di dati richiedono diverse ore per la formazione.
È chiaro che le GPU sono molto meglio in parallelo rispetto alle CPU. Al momento, ho solo CPU con cui lavorare. Potrei accedere a 16 CPU (2 thread per core X 4 core per socket X 2 socket)
Dal documento di supporto multi-core in Theano, sono riuscito a utilizzare tutti e quattro i core di un singolo socket. Quindi, sostanzialmente la CPU ha un utilizzo del 400% con 4 CPU utilizzate e le restanti 12 CPU rimangono inutilizzate. Come li uso anche io. Tensorflow potrebbe anche essere usato al posto dello sfondo di Theano, se funziona.