Qual è la differenza tra e il punteggio di varianza in Scikit-learn?


12

Stavo leggendo le metriche di regressione nel manuale di Python Scikit-Learn e anche se ognuna di esse ha la sua formula, non posso dire intuitivamente qual è la differenza tra e il punteggio di varianza e quindi quando usare l'uno o l'altro per valutare i miei modelli.R2

Risposte:


4
  1. R2=1-SSETSS
  2. ha spiegato il punteggio di varianza=1-Vun'r[y^-y]/Vun'r[y]V a r V una r [ y - y ] = s u m ( e r r o r 2 - m all'e un n ( e r r o r ) ) , in cui il è una varianza parziale, ovvero . Rispetto a , l'unica differenza è dalla media (errore). se media (errore) = 0, allora = punteggio varianza spiegatoVun'rVun'r[y^-y]=Sum(error2-meun'n(error))/nR2R2

  3. Si noti inoltre che in rettificato viene utilizzata la stima della varianza imparziale.R2


2
sklearn non ha aggiustato-R2, vero?
Hack-R,

@ Hack-R effettivamente ha
mMontu

1

La risposta di Dean è giusta.

Solo io penso che ci sia un piccolo errore di battitura qui: .Vun'r[y^-y]=Sum(error2-meun'n(error))/n

Immagino che dovrebbe essere .Vun'r[y^-y]=Sum(error-meun'n(error))2/n

Il mio riferimento è il codice sorgente di sklearn qui: https://github.com/scikit-learn/scikit-learn/blob/bf24c7e3d/sklearn/metrics/_regression.py#L396

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.