Come interpretare le misure di errore?


41

Sto eseguendo la classificazione in Weka per un determinato set di dati e ho notato che se sto cercando di prevedere un valore nominale, l'output mostra in modo specifico i valori previsti correttamente e in modo errato. Tuttavia, ora lo sto eseguendo per un attributo numerico e l'output è:

Correlation coefficient                 0.3305
Mean absolute error                     11.6268
Root mean squared error                 46.8547
Relative absolute error                 89.2645 %
Root relative squared error             94.3886 %
Total Number of Instances               36441 

Come posso interpretarlo? Ho provato a cercare su google ogni nozione ma non capisco molto dato che le statistiche non sono affatto nel mio campo di competenza. Gradirei molto un tipo di risposta ELI5 in termini di statistiche.

Risposte:


52

Diamo denotano il vero valore di interesse come e il valore stimato utilizzando alcuni algoritmo come θ .θθ^

Correlazione ti dice quanto e θ sono correlate. Dà valori compresi tra - 1 e 1 , dove 0 è alcuna relazione, 1 è molto forte, relazione lineare e - 1 è un inverso relazione lineare (ossia i valori maggiori di θ indicano valori minori di θ , o viceversa). Di seguito troverai un esempio illustrato di correlazione.θθ^11011θθ^

Correlation example

(fonte: http://www.mathsisfun.com/data/correlation.html )

L'errore assoluto medio è:

MAE=1Ni=1N|θ^iθi|

L' errore quadratico medio di root è:

RMSE=1Ni=1N(θ^iθi)2

Errore assoluto relativo :

RAE=i=1N|θ^iθi|i=1N|θ¯θi|

dove è un valore medio di θ .θ¯θ

Errore quadratico relativo radice:

RRSE=i=1N(θ^iθi)2i=1N(θ¯θi)2

Come vedi, tutte le statistiche confrontano i valori reali con le loro stime, ma lo fanno in modo leggermente diverso. Tutti ti dicono "quanto lontano" sono i tuoi valori stimati dal vero valore di . A volte vengono utilizzate le radici quadrate e talvolta i valori assoluti - questo perché quando si usano le radici quadrate i valori estremi hanno una maggiore influenza sul risultato (vedere Perché quadrare la differenza invece di prendere il valore assoluto nella deviazione standard? O su Mathoverflow ).θ

In MAE and RMSE you simply look at the "average difference" between those two values - so you interpret them comparing to the scale of your valiable, (i.e. MSE of 1 point is a difference of 1 point of θ between θ^ and θ).

In RAE and RRSE you divide those differences by the variation of θ so they have a scale from 0 to 1 and if you multiply this value by 100 you get similarity in 0-100 scale (i.e. percentage). The values of (θ¯θi)2 or |θ¯θi| tell you how much θ differs from it's mean value - so you could tell that it is about how much θ differs from itself (compare to variance). Because of that the measures are named "relative" - they give you result related to the scale of θ.

Check also those slides.


Thank you for your explanation! I am trying to evaluate the performance of various algorithms. So for example, if I get this other output (Correlation: 0.3044, MAE: 10.832, MSE: 47.2971, RAE: 83.163%, RSE: 95.2797%) and I try to compare it to the first one, which one could I say performed better?
FloIancu

5
You should choose the model with bigger correlation and smaller error estimates. As you see, there are multiple measures of model performance (and those are only few them) and sometimes they give different answers. It is almost never the "yes/no" kind of answer you get. The task of model selection would get easier if you catch up with theory, you can check for example those lectures.
Tim

Thank you very much! I went ahead and marked your reply as the answer because you've helped me plenty!
FloIancu

1
@Tim Mean absolute error should probably be abbreviated as MAE:)
Antoine

1
@MewX What kind of references you are looking for? It is basically a rescaled RMSE. There is not much to say about it...
Tim
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.