Per qualsiasi numero con mean
, la varianza è data da
Applicando al dato set di numeri
che consideriamo per comodità in esposizione avere media , abbiamo quello
y 1 , y 2 , … , y N ˉ y = 1Ny1, y2, ... , yN σ 2y¯= 1NΣi = 1Nyio(1)nx1,x2,…xnˉx=0σ2=1
σ2σ2= 1N- 1Σi = 1N( yio- y¯)2= 1N- 1Σi = 1N( y2io- 2 anniioy¯+ y¯2)= 1N- 1[ ( ∑i = 1Ny2io) -2N( y¯)2+ N( y¯)2]= 1N- 1Σi = 1N( y2io- ( y¯)2)(1)
( 1 )nX1, x2, ... xnX¯= 0 xn+11σ2= 1n - 1Σi = 1n( x2io- ( x¯)2) = 1n - 1Σi = 1nX2io
Se ora aggiungiamo una nuova osservazione a questo set di dati, la nuova media del set di dati è
mentre la nuova varianza è
Quindideve essere più grande di
Xn + 1σ 21n + 1Σi = 1n + 1Xio= n x¯+ xn + 1n + 1= xn + 1n + 1
| xn+1| σ√σ^2= 1nΣi = 1n + 1( x2io- x2n + 1( n + 1 )2)= 1n[ ( ( n - 1 ) σ2+ x2n + 1) - x2n + 1n + 1]=1n[ (n-1) σ2+ nn + 1X2n + 1]> σ2 solo se x 2n + 1> n + 1nσ2.
| Xn + 1| xn+1ˉxσ√σ1 + 1n-----√
o, più in generale, deve differire dalla media del set di dati originale di più di , affinché il set di dati aumentati abbia una varianza maggiore rispetto al set di dati originale. Vedi anche la risposta di Ray Koopman che sottolinea che la nuova varianza è maggiore, uguale o minore di, la varianza originale secondo
differisce dalla media di più di, esattamente o meno di .
Xn + 1X¯ xn+1σ√σ1 + 1n-----√xn+1σ1+1n−−−−−√