Ultimamente ho cercato di saperne di più sull'apprendimento online (è assolutamente affascinante!), E un tema su cui non sono stato in grado di capire bene è come pensare alla selezione dei modelli in contesti offline e online. In particolare, supponiamo ci alleniamo un classificatore non in linea, sulla base di un insieme di dati fissa . Stimiamo le sue caratteristiche prestazionali attraverso la validazione incrociata, diciamo, e selezioniamo il miglior classificatore in questo modo.
Questo è ciò a cui ho pensato: come, quindi, facciamo l'applicazione a un'impostazione online? Possiamo supporre che la migliore trovate offline funzionino bene anche come classificatore online? Ha senso raccogliere alcuni dati per addestrare , quindi prendere lo stesso classificatore S e "metterlo in funzione" in un'impostazione online con gli stessi parametri trovati su D , o potrebbe essere un altro approccio migliore? Quali sono le avvertenze in questi casi? Quali sono i risultati chiave qui? E così via.
Ad ogni modo, ora che è là fuori, immagino che quello che sto cercando siano alcuni riferimenti o risorse che mi aiuteranno (e, si spera, altri, che hanno pensato a questo genere di cose!) A fare la transizione dal pensare esclusivamente in termini offline, e sviluppare la struttura mentale per pensare alla questione della selezione del modello e di queste domande in modo più coerente man mano che la mia lettura avanza.