Risposte:
LSTM ha un set di 2 matrici: U e W per ciascuna delle (3) porte. Il simbolo (.) Nel diagramma indica la moltiplicazione di queste matrici con l'ingresso uscita .
Quindi # parametri totali =
Tuttavia, nel caso in cui il tuo LSTM includa vettori di polarizzazione ( ad esempio , questo è il valore predefinito in keras ), il numero diventa:
Secondo questo :
Struttura cellulare LSTM
Equazioni LSTM
Ingegnerizzazione delle non linearità
Se l'ingresso x_t ha dimensioni n × 1 e sono presenti celle di memoria d , la dimensione di ciascuna di W ∗ e U ∗ è d × n e d × d resp. La dimensione di W sarà quindi 4d × (n + d) . Si noti che ciascuna delle celle di memoria dd ha i propri pesi W ∗ e U ∗ e che l'unica volta in cui i valori delle celle di memoria vengono condivisi con altre unità LSTM è durante il prodotto con U ∗ .
Grazie ad Arun Mallya per l'ottima presentazione.