Calcolo della probabilità da RMSE


13

Ho un modello per prevedere una traiettoria (x in funzione del tempo) con diversi parametri. Al momento, calcolo l'errore quadratico medio radice (RMSE) tra la traiettoria prevista e la traiettoria registrata sperimentalmente. Attualmente, minimizzo questa differenza (RMSE) usando simplex (fminsearch in matlab). Mentre questo metodo funziona per fornire buoni accoppiamenti, vorrei confrontare diversi modelli diversi, quindi penso di dover calcolare la probabilità in modo da poter utilizzare la stima della massima verosimiglianza piuttosto che minimizzare l'RMSE (e quindi confrontare i modelli usando AIC o BIC ). Esiste un modo standard per farlo?

Risposte:


20

L'errore al quadrato della radice e la probabilità sono in realtà strettamente correlati. Supponi di avere un set di dati di coppie e desideri modellare la loro relazione utilizzando il modello f . Decidi di ridurre al minimo l'errore quadratico{xi,zi}f

i(f(xi)zi)2

Questa scelta non è del tutto arbitraria? Certo, vuoi penalizzare le stime che sono completamente sbagliate più di quelle che hanno ragione. Ma c'è un'ottima ragione per usare l'errore al quadrato.

Ricorda la densità gaussiana: doveZè la costante di normalizzazione che non ci interessa per ora. Supponiamo che i tuoi dati targetzsiano distribuiti secondo un gaussiano. In questo modo possiamo annotare la probabilità dei dati.1Zexp(xμ)22σ2Zz

L=i1Zexp(f(xi)zi)22σ2

Ora se prendi il logaritmo di questo ...

logL=i(f(xi)zi)22σ2logZ

... risulta che è strettamente correlato all'rms: le uniche differenze sono alcuni termini costanti, una radice quadrata e una moltiplicazione.

Per farla breve: minimizzare l'errore quadratico medio della radice equivale a massimizzare la probabilità di log dei dati.


Grazie per la chiara spiegazione. Quindi, se voglio confrontare due modelli (non incorporati) usando BIC, posso semplicemente eliminare i termini sigma ^ 2 e Z (assumendo effettivamente che siano gli stessi tra i modelli) quando si calcola la probabilità?
Jason,

σσ

1
logL=i(f(xi)zi)22σ2logZ

2
C'è un segno negativo mancante nella distribuzione gaussiana?
Manoj,

1
σ
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.