Diciamo che ho un classificatore di regressione logistica. Nell'apprendimento in batch normale, avrei un termine di regolarizzazione per prevenire un eccesso di adattamento e mantenere i miei pesi piccoli. Inoltre normalizzerei e ridimensionerei le mie funzionalità.
In un ambiente di apprendimento online, sto ottenendo un flusso continuo di dati. Faccio un aggiornamento della discesa gradiente con ogni esempio e poi lo scarto. Dovrei usare il termine di ridimensionamento e regolarizzazione delle funzionalità nell'apprendimento online? Se sì, come posso farlo? Ad esempio, non ho un set di dati di allenamento su cui scalare. Inoltre, non ho impostato la convalida per ottimizzare il mio parametro di regolarizzazione. Se no, perché no?
Nel mio apprendimento online, ricevo continuamente un flusso di esempi. Per ogni nuovo esempio, faccio una previsione. Quindi, nel passaggio successivo, ottengo il target effettivo e eseguo l'aggiornamento della discesa del gradiente.