Sto leggendo questo documento "Sequence to Sequence Learning with Neural Networks" http://papers.nips.cc/paper/5346-sequence-to-sequence-learning-with-neural-networks.pdf
Sotto "2. Il modello" si dice:
L'LSTM calcola questa probabilità condizionale ottenendo prima la rappresentazione dimensionale fissa v della sequenza di input (x1,..., XT) data dall'ultimo stato nascosto dell'LSTM, e quindi calcolando la probabilità di y1,. . . , yT ′ con una formulazione LSTM-LM standard il cui stato nascosto iniziale è impostato sulla rappresentazione v di x1 ,. . . , xT:
So cos'è un LSTM, ma cos'è un LSTM-LM? Ho provato a cercarlo su Google ma non riesco a trovare buoni contatti.