Valutare le prestazioni di un modello di regressione usando training e set di test?


10

Sento spesso di valutare le prestazioni di un modello di classificazione tenendo il set di test e allenando un modello sul set di allenamento. Quindi creando 2 vettori, uno per i valori previsti e uno per i valori reali. Ovviamente fare un confronto consente di giudicare le prestazioni del modello in base al suo potere predittivo usando cose come F-Score, Kappa Statistic, Precision & Recall, curve ROC ecc.

In che modo questo si confronta con la valutazione della previsione numerica come la regressione? Suppongo che potresti addestrare il modello di regressione sul set di addestramento, usarlo per prevedere i valori, quindi confrontare questi valori previsti con i valori reali presenti nel set di test. Ovviamente le misure di prestazione dovrebbero essere diverse poiché questo non è un compito di classificazione. I soliti residui e le statistiche sono misure ovvie ma ci sono modi più / migliori per valutare le prestazioni per i modelli di regressione? Sembra che la classificazione abbia tante opzioni ma la regressione è lasciata a e ai residui.R2R2


1
Non sono sicuro di quale domanda si stia ponendo, ma una metrica di errore evidente per un modello di regressione con un output continuo è un errore quadratico medio (MSE) tra l'output del modello e la variabile di risultato.
BGreene,

Quindi solo una misura di errore tra l'effettivo e il previsto.
StatTime

Sì, ottimizzato sul set di allenamento e convalidato utilizzando il set di test.
BGreene,

Risposte:


2

Come detto, in genere viene utilizzato l'errore quadratico medio. Calcoli il tuo modello di regressione in base al tuo set di allenamento e ne valuti le prestazioni utilizzando un set di test separato (un set su input x e output previsti noti y) calcolando l'MSE tra gli output del set di test (y) e gli output forniti dal modello (f (x)) per gli stessi input dati (x).

In alternativa puoi utilizzare le seguenti metriche: Errore quadratico medio radice, Errore quadrato relativo, Errore assoluto medio, Errore assoluto relativo ... (chiedi a google le definizioni)


Buona risposta. Questi sono tutti associati al secondo momento della distribuzione. Puoi anche esaminare la somma delle differenze se stai cercando di eliminare la distorsione o utilizzare qualsiasi combinazione desideri. Ad esempio, dove A e B sono scelti pesi per ciascun metodo di punteggio. In realtà dipenderà da quali fattori sono importanti per il tuo problema specifico. err=UNΣ(X-Xio)+BΣ(X-Xio)2
Greg Petersen,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.