Comprensione concettuale della radice significa errore al quadrato e deviazione di polarizzazione media


13

Vorrei acquisire una comprensione concettuale di Root Mean Squared Error (RMSE) e Mean Bias Deviation (MBD). Avendo calcolato queste misure per i miei confronti di dati, sono stato spesso perplesso nello scoprire che l'RMSE è alto (ad esempio, 100 kg), mentre l'MBD è basso (ad esempio, meno dell'1%).

Più specificamente, sto cercando un riferimento (non online) che elenchi e discuti la matematica di queste misure. Qual è il modo normalmente accettato per calcolare queste due misure e come devo segnalarle in un articolo di giornale?

Sarebbe davvero utile nel contesto di questo post avere un set di dati "giocattolo" che può essere usato per descrivere il calcolo di queste due misure.

Ad esempio, supponiamo che io debba trovare la massa (in kg) di 200 widget prodotti da una catena di montaggio. Ho anche un modello matematico che tenterà di prevedere la massa di questi widget. Il modello non deve essere empirico e può essere basato fisicamente. Calcolo l'RMSE e l'MBD tra le misurazioni effettive e il modello, trovando che l'RMSE è di 100 kg e l'MBD dell'1%. Cosa significa concettualmente e come interpreterei questo risultato?

Ora supponiamo che dal risultato di questo esperimento trovo che l'RMSE è di 10 kg e l'MBD dell'80%. Che cosa significa questo e cosa posso dire di questo esperimento?

Qual è il significato di queste misure e cosa implicano entrambi (presi insieme)? Quali informazioni aggiuntive fornisce l'MBD se considerato con l'RMSE?


2
Hai dato un'occhiata al nostro sito, Nicholas? Prendi in considerazione di iniziare da stats.stackexchange.com/a/17545 e quindi esplorare alcuni dei tag che ho aggiunto alla tua domanda.
whuber

@whuber: Grazie whuber !. Mi sono guardato intorno nel sito, ma per me lo trovo ancora un po 'difficile capire cosa si intende veramente nel contesto della mia ricerca.
Nicholas Kinar,

Risposte:


21

Penso che questi concetti siano facili da spiegare. Quindi preferirei descriverlo qui. Sono sicuro che molti libri di statistica elementare coprono questo, incluso il mio libro "Gli elementi essenziali della biostatistica per medici, infermieri e clinici".

Pensa a un bersaglio con un occhio di bue nel mezzo. L'errore quadrato medio rappresenta la distanza media quadrata da una freccia lanciata sul bersaglio e sul centro. Ora se le tue frecce si sparpagliano uniformemente attorno al centro, il tiratore non ha distorsioni di mira e l'errore quadrato medio è lo stesso della varianza.

Ma in generale le frecce possono sparpagliarsi intorno a un punto lontano dal bersaglio. La distanza media quadrata delle frecce dal centro delle frecce è la varianza. Questo centro potrebbe essere considerato come il punto di mira dei tiratori. La distanza dal centro di questo tiratore o dal punto di mira al centro del bersaglio è il valore assoluto della distorsione.

Pensando a un triangolo rettangolo in cui il quadrato dell'ipotenusa è la somma dei quadrati dei due lati. Quindi una distanza quadrata dalla freccia al bersaglio è il quadrato della distanza dalla freccia al punto di mira e il quadrato della distanza tra il centro del bersaglio e il punto di mira. La media di tutte queste distanze quadrate fornisce l'errore quadratico medio come la somma del bias al quadrato e la varianza.


Grazie; questo è molto apprezzato. Sto ancora trovando un po 'stimolante capire qual è la differenza tra RMSE e MBD. Da quanto ho capito, RMSE quantifica quanto è vicino un modello ai dati sperimentali, ma qual è il ruolo di MBD? Forse il mio malinteso è solo associato alla terminologia.
Nicholas Kinar,

1
La deviazione di bias media mentre la chiami è il termine di bias che ho descritto. Misura quanto lontano il punto di mira è lontano dal bersaglio. La distorsione contribuisce a rendere impreciso lo scatto.
Michael R. Chernick,

Grazie ancora, Michael. Quindi un RMSE alto e un MBD basso implica che è un buon modello?
Nicholas Kinar,

Nessun RMSE alto e un MBD basso dicono solo che il modello è scarso a causa di una grande varianza piuttosto che di un grande pregiudizio. RMSE è il numero che decide quanto è buono il modello.
Michael R. Chernick,

1
@bbadyalina: sono informazioni indipendenti, allo stesso modo in cui su / giù e sinistra / destra sono indipendenti. La tua domanda è come chiedere "se un punto è centrato verticalmente e lontano dalla sinistra, è nel mezzo?" o "Se un punto è in alto, ma orizzontalmente al centro, è al centro?"
naught101

1

RMSE è un modo per misurare quanto è buono il nostro modello predittivo rispetto ai dati reali, più piccolo RMSE è il modo migliore di comportarsi nel modello, cioè se lo testassimo su un nuovo set di dati (non sul nostro set di formazione) ma poi avessimo di nuovo un RMSE di 0,37 su un intervallo da 0 a 1, rappresenta un sacco di errori rispetto ad avere un RMSE di 0,01 come modello migliore. BIAS è da sottovalutare o da sottovalutare.


Potresti fornire maggiori dettagli e un esempio elaborato? L'OP sta cercando una spiegazione intuitiva del significato di un RMSE di, diciamo, 100, contro il suo problema di stima.
Xi'an,

Questo non sembra fornire molta intuizione. Puoi spiegare di più?
Glen_b

0

Per quanto posso capire, un RMSE fornisce un valore più accurato dell'errore tra il modello e osservato, tuttavia il BIAS, oltre a fornire un valore dell'errore (meno accurato del RMSE), può anche determinare se il modello è bias positivo o bias negativo, se il modello sta sottovalutando o sopravvalutando i valori osservati.


No. Puoi pensare a RMSE come alla "precisione" di un modello, ad esempio quanta diffusione esiste negli errori delle sue previsioni (nota: la precisione è l'inverso della varianza - alta varianza = bassa precisione). E puoi considerare il Bias come un errore sistematico nel modello, ad esempio il valore medio di tutti gli errori. La "precisione" del lavoro è una vaga combinazione di entrambi e quindi crea molta confusione.
naught101
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.