Ho studiato LSTM per un po '. Capisco ad alto livello come funziona tutto. Tuttavia, andando a implementarli usando Tensorflow, ho notato che BasicLSTMCell richiede un numero di unità (es. num_units
) Parametro.
Da questa spiegazione molto approfondita degli LSTM, ho scoperto che una singola unità LSTM è una delle seguenti
che in realtà è un'unità GRU.
Presumo che quel parametro num_units
di BasicLSTMCell
si riferisca a quanti di questi vogliamo collegarci l'un l'altro in un livello.
Ciò lascia la domanda: cos'è una "cellula" in questo contesto? Una "cellula" equivale a uno strato in una normale rete neurale feed-forward?