Con un ragionamento simile a quello qui , potrei essere in grado di dare una risposta alla tua domanda a determinate condizioni.
Lascia che sia il tuo vero valore per il punto dati e il valore stimato. Se assumiamo che le differenze tra i valori stimati e reali abbiano i t h x iXioiot hX^io
media zero (ovvero i sono distribuiti intorno a )xiX^ioXio
seguire una distribuzione normale
e tutti hanno la stessa deviazione standardσ
in breve:
X^io- xio∼ N( 0 , σ2) ,
allora vuoi davvero un intervallo di confidenza per .σ
Se i presupposti di cui sopra sono veri
segue una distribuzione con (non ) gradi di la libertà. Questo significa χ 2 n nn-1
n RMSE2σ2= n 1nΣio( xio^- xio)2σ2
χ2nnn - 1
P( χ2α2, n≤ n RMSE2σ2≤ χ21 - α2, n) =1-α⇔ P⎛⎝n RMSE2χ21 - α2, n≤ σ2≤ n RMSE2χ2α2, n⎞⎠= 1 - α⇔ P⎛⎝⎜nχ21 - α2, n------√RMSE ≤σ≤ nχ2α2, n-----√RMSE ⎞⎠⎟= 1 - α .
Pertanto,
è il tuo intervallo di confidenza.
⎡⎣⎢nχ21 - α2, n------√RMSE , nχ2α2, n-----√RMSE ⎤⎦⎥
Ecco un programma Python che simula la tua situazione
from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
y[i] =sqrt( mean((random.randn(n)*s)**2))
print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)
Spero possa aiutare.
Se non sei sicuro che le ipotesi si applichino o se desideri confrontare ciò che ho scritto con un metodo diverso, puoi sempre provare il bootstrap .