Le reti Maxout erano un'idea semplice ma geniale di Goodfellow et al. dal 2013 al massimo mappe delle caratteristiche per ottenere un approssimatore universale di attivazioni convesse. Il design è stato adattato per l'uso in combinazione con il dropout (poi recentemente introdotto) e ha ovviamente portato a risultati all'avanguardia su benchmark come CIFAR-10 e SVHN.
Cinque anni dopo, l'abbandono è sicuramente ancora in gioco, ma per quanto riguarda il maxout? Il documento è ancora ampiamente citato in documenti recenti secondo Google Scholar, ma sembra che quasi nessuno stia effettivamente utilizzando la tecnica.
Quindi il maxout è un ricordo del passato e, in caso affermativo, perché - cosa l'ha resa una delle migliori prestazioni nel 2013 ma non nel 2018?