Domande taggate «overfitting»

L'errore di modellazione (in particolare l'errore di campionamento) anziché le relazioni replicabili e informative tra le variabili migliora le statistiche di adattamento del modello, ma riduce la parsimonia e peggiora la validità esplicativa e predittiva.


1

1
Come selezionare la soluzione migliore senza dati eccessivi? Modellazione di una distribuzione bimodale con N funzioni normali, ecc
Ho una distribuzione ovviamente bimodale di valori, che cerco di adattare. I dati possono essere adattati bene con 2 funzioni normali (bimodali) o con 3 funzioni normali. Inoltre, esiste un motivo fisico plausibile per adattare i dati con 3. Più parametri vengono introdotti, più perfetta sarà la misura, come con …

4
Sovrapposizione con classificatori lineari
Oggi il nostro professore ha dichiarato in classe che "non è possibile un overfitting con classificatori lineari". Ritengo che sia sbagliato, dal momento che anche i classificatori lineari possono essere sensibili agli outlier nel set di training - prendiamo ad esempio un margine duro. Support Vector Machine: un singolo punto …



2
Spiegazione lucida per la "stabilità numerica dell'inversione della matrice" nella regressione della cresta e il suo ruolo nella riduzione dell'overfit
Capisco che possiamo impiegare la regolarizzazione in un problema di regressione dei minimi quadrati come w∗=argminw[(y−Xw)T(y−Xw)+λ∥w∥2]w∗=argminw⁡[(y−Xw)T(y−Xw)+λ‖w‖2]\boldsymbol{w}^* = \operatorname*{argmin}_w \left[ (\mathbf y-\mathbf{Xw})^T(\boldsymbol{y}-\mathbf{Xw}) + \lambda\|\boldsymbol{w}\|^2 \right] e che questo problema ha una soluzione a forma chiusa come: w^=(XTX+λI)−1XTy.w^=(XTX+λI)−1XTy.\hat{\boldsymbol{w}} = (\boldsymbol{X}^T\boldsymbol{X}+\lambda\boldsymbol{I})^{-1}\boldsymbol{X}^T\boldsymbol{y}. Vediamo che nella seconda equazione, la regolarizzazione sta semplicemente aggiungendo λλ\lambda alla …




3
Adattarsi di proposito
Avrebbe senso sovralimentare un modello di proposito? Supponiamo di avere un caso d'uso in cui so che i dati non varieranno molto rispetto ai dati di addestramento. Sto pensando qui alla previsione del traffico, in cui lo stato del traffico segue una serie fissa di schemi pendolarismo mattutino attività notturna …
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.