Qual è la differenza tra "coefficiente di determinazione" e "errore quadratico medio"?


33

Per problemi di regressione, ho visto le persone usare il "coefficiente di determinazione" (aka R quadrato) per eseguire la selezione del modello, ad esempio, trovare il coefficiente di penalità appropriato per la regolarizzazione.

Tuttavia, è anche comune usare "errore quadrato medio" o "errore quadrato medio radice" come misura dell'accuratezza della regressione.

Quindi qual è la differenza principale tra questi due? Potrebbero essere usati in modo intercambiabile per compiti di "regolarizzazione" e di "regressione"? E quali sono i principali utilizzi di ciascuno in pratica, come nell'apprendimento automatico, nelle attività di data mining?

Risposte:


40

SSESSTYR2=1SSESST , dove è la somma dell'errore al quadrato (residui o deviazioni dalla linea di regressione) e è la somma delle deviazioni al quadrato dalla media del dipendente .SSESSTY

nmMSE=SSEn-m , dove è la dimensione del campione e è il numero di parametri nel modello (inclusa l'intercettazione, se presente).nm

M S E R 2 R 2R2 è una misura standardizzata del grado di previsione o adattamento nel campione. è la stima della varianza dei residui, o non idonei, nella popolazione. Le due misure sono chiaramente correlate, come si vede nella formula più usuale per aggiustata (la stima di per la popolazione):MSE R2R2

Run'dj2=1-(1-R2)n-1n-m=1-SSE/(n-m)SST/(n-1)=1-MSEσy2 .


2
Pensavo che MSE fosse la media degli errori, che significa MSE = SSE / n, in quali occasioni utilizziamo MSE = SSE / (nm)? Spiega per favore. Grazie
Sincole Brans il

@SincoleBrans Vedi en.wikipedia.org/wiki/Mean_squared_error , sezione "Regressione".
ttnphns,

Sono un po 'confuso. I risultati in martin-thoma.com/regression mostrano che un modello può essere buono (rispetto ad alcuni altri modelli) con R ^ 2, ma allo stesso tempo cattivo con MSE. Potresti spiegarlo?
Martin Thoma,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.