Mi chiedo perché l'addestramento di RNN in genere non utilizzi il 100% della GPU.
Ad esempio, se eseguo questo benchmark RNN su un Maxwell Titan X su Ubuntu 14.04.4 LTS x64, l'utilizzo della GPU è inferiore al 90%:
Il benchmark è stato lanciato usando il comando:
python rnn.py -n 'fastlstm' -l 1024 -s 30 -b 128
Come posso diagnosticare il collo di bottiglia?