Durante l'allenamento delle reti neurali, un iperparametro ha le dimensioni di un mini-batch. Le scelte comuni sono 32, 64 e 128 elementi per mini batch.
Ci sono regole / linee guida su quanto dovrebbe essere grande un mini-batch? Qualche pubblicazione che indaga l'effetto sulla formazione?