Sto espandendo la mia conoscenza del pacchetto Keras e ho lavorato con alcuni dei modelli disponibili. Ho un problema di classificazione binaria NLP che sto cercando di risolvere e ho applicato diversi modelli.
Dopo aver lavorato con alcuni risultati e aver letto sempre di più su LSTM, sembra che questo approccio sia di gran lunga superiore a qualsiasi altra cosa abbia provato (su più set di dati). Continuo a pensare a me stesso, "perché / quando non dovresti usare LSTM?". L'uso delle porte aggiuntive, inerente a LSTM, ha perfettamente senso per me dopo aver avuto alcuni modelli che soffrono di sfumature evanescenti.
Allora, qual è il problema con LSTM? Dove non lo fanno così bene? So che non esiste un algoritmo "taglia unica", quindi ci deve essere un aspetto negativo di LSTM.