RMSE e MAE possono avere lo stesso valore?


9

Sto implementando la validazione incrociata e il calcolo delle metriche di errore come RMSE, , MAE, MSE, ecc.R2

RMSE e MAE possono avere lo stesso valore?


1
Sì. Perchè no? Sia sempre e un predittore per sia sempre . Ecco 0 X 1X0X1
David,

Risposte:


17

Sì, in teoria. Il caso più semplice che posso immaginare è un set di dati in cui tutti gli errori di previsione (ovvero i residui) sono esattamente 1. RMSE e MAE restituiranno valori identici a 1. Si possono costruire anche altri scenari, ma nessuno sembra molto probabile.±

EDIT: Grazie a @DilipSarwate per aver sottolineato (ulteriormente elaborato da @ user20160 nella loro eccellente risposta) che questo risultato è possibile se e solo se i valori assoluti di tutti gli errori di previsione sono identici. Non c'è niente di speciale nel valore 1 nel mio esempio, in altre parole; qualsiasi altro numero funzionerebbe invece di 1.±


1
Potresti dare un esempio degli altri scenari che prevedi? Intendo un esempio diverso da un multiplo scalare (quando tutti i residui sono anziché ) dell'esempio sopra. ± 1±σ±1
Dilip Sarwate,

@DilipSarwate Stavo riflettendo su questo quando user20160 ha aggiunto una risposta molto migliore che la copre in modo più dettagliato di quanto potessi.
mkt - Ripristina Monica il

1
@mkt Grazie per le belle parole. La tua risposta è corretta e concisa (+1)
user20160

@DilipSarwate Grazie per l'input
mkt - Ripristina Monica il

1
Un paio di abbellimenti aggiuntivi alla tua risposta: (i) deve essere pari (diciamo n = 2 k ) e (ii) esattamente k residui devono avere valore + σ e esattamente k residui devono avere valore - σ , che ovviamente significa che tutti i residui hanno valore assoluto σ come si afferma, ma (ii) assicura che i residui si sommino a 0 come devono. I residui sono le deviazioni dalla media e quindi devono riassumere a zero. nn=2kk+σkσσ0
Dilip Sarwate,

23

L'errore assoluto medio (MAE) può eguagliare l'errore quadratico medio (MSE) o l'errore quadratico medio radice (RMSE) in determinate condizioni, che mostrerò di seguito. È improbabile che queste condizioni si verifichino nella pratica.

Preliminari

Sia rio=|yio-y^io|denota il valore assoluto del residuo per l' io esimo punto dati e lascia che r=[rio,...,rn]T sia un vettore contenente residui assoluti per tutti gli n punti nel set di dati. Lasciando 1 denota un vettore n×1 di quelli, MAE, MSE e RMSE possono essere scritti come:

(1)MUNE=1n1TrMSE=1nrTrRMSE=1nrTr

MSE

Impostare MSE uguale al MAE e riordinare dà:

(2)(r-1)Tr=0

MSE e MAE sono uguali per tutti i set di dati in cui i residui assoluti risolvono l'equazione di cui sopra. Due soluzioni ovvie sono: r=0 (errore zero) e r=1 (i residui sono tutti ±1 , come menzionato mkt). Ma ci sono infinite soluzioni.

Possiamo interpretare l'equazione (2) geometricamente come segue: LHS è il prodotto punto di r-1 e r . Il prodotto a punto zero implica l'ortogonalità. Quindi, MSE e MAE sono uguali se sottraendo 1 da ciascun residuo assoluto si ottiene un vettore ortogonale ai residui assoluti originali.

Inoltre, completando il quadrato, l'equazione (2) può essere riscritta come:

(3)(r-121)T(r-121)=n4

Questa equazione descrive una sfera n dimensionale centrata su [12,...,12]Tcon raggio12n . MSE e MAE sono uguali se e solo se i residui assoluti si trovano sulla superficie di questa ipersfera.

RMSE

Impostando RMSE uguale a MAE e riordinando si ottiene:

(4)rTUNr=0

UN=(nio-11T)

dove io sono la matrice dell'identità. Il set di soluzioni è lo spazio nullo di UN ; vale a dire, l'insieme di tutte r tale che UNr=0 . Per trovare lo spazio nullo, nota che UN è una matrice n×n con elementi diagonali uguali a n-1 e tutti gli altri elementi uguali a -1 . L'istruzione UNr=0 corrisponde al sistema di equazioni:

(5)(n-1)rio-Σjiorj=0io

Oppure, riordinando le cose:

(6)rio=1n-1Σjiorjio

Cioè, ogni elemento rio deve essere uguale alla media degli altri elementi. L'unico modo per soddisfare questo requisito è che tutti gli elementi siano uguali (questo risultato può anche essere ottenuto considerando la composizione geografica di UN ). Pertanto, il set di soluzioni è costituito da tutti i vettori non negativi con voci identiche:

{r|r=c1c0}

Quindi, RMSE e MAE sono uguali se e solo se i valori assoluti dei residui sono uguali per tutti i punti dati.


1
r

1
In realtà, la domanda era se RMSE e MAE possano mai essere uguali e non se MSE e MAE possano mai essere uguali. Forse la risposta di @ mkt (o la sua versione generalizzata che ho suggerito in un commento) è l'unica risposta alla domanda RMSE = MAE?
Dilip Sarwate,

@DilipSarwate, Sì, dopo aver pubblicato questo ho realizzato che avevo saltato la parte 'R'. Ho modificato per includere RMSE ora. Credo che la versione che hai suggerito sia l'unica risposta possibile in questo caso.
user20160

@whuber Questo è un buon punto. Proverò a modificare qualcosa del genere.
user20160

2
@Hiyam Se esiste solo 1 valore, RMSE per definizione deve essere uguale a MAE. Perché c'è solo 1 errore, quadrarlo e prendere la radice restituisce solo il valore assoluto dell'errore originale.
mkt - Ripristina Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.