Imparare una varianza è difficile.
In molti casi è necessario un numero (forse sorprendentemente) di campioni per stimare bene una varianza. Di seguito, mostrerò lo sviluppo del caso "canonico" di un campione normale iid.
Supponiamo che , i = 1 , … , n siano variabili casuali indipendenti N ( μ , σ 2 ) . Cerchiamo un intervallo di confidenza del 100 ( 1 - α ) % per la varianza in modo tale che la larghezza dell'intervallo sia ρ s 2 , ovvero la larghezza sia del 100 ρ % della stima puntuale. Ad esempio, se ρ = 1 / 2 , allora la larghezza del C'è metà del valore della stima puntuale, ad esempio, seYii=1,…,nN(μ,σ2)100(1−α)%ρs2100ρ%ρ=1/2 , quindi l'IC sarebbe qualcosa di simile ( 8 ,s2=10 , con una larghezza di 5. Notare anche l'asimmetria attorno alla stima puntuale. ( s 2 è lo stimatore imparziale per la varianza.)(8,13)s2
"L '" (piuttosto, "a") intervallo di confidenza per è
( n - 1 ) s 2s2
dove χ 2
(n−1)s2χ2(1−α/2)(n−1)≤σ2≤(n−1)s2χ2(α/2)(n−1),
è ilquantile
βdella distribuzione chi-quadrato con
n-1gradi di libertà. (Ciò deriva dal fatto che
(n-1)s2/σ2è una quantità fondamentale in un ambiente gaussiano.)
χ2β(n−1)βn−1(n−1)s2/σ2
Vogliamo ridurre al minimo la larghezza in modo che
quindi siamo lasciati a risolvere per n tale che
( n - 1 ) ( 1
L(n)=(n−1)s2χ2(α/2)(n−1)−(n−1)s2χ2(1−α/2)(n−1)<ρs2,
n(n−1)⎛⎝⎜1χ2(α/2)(n−1)−1χ2(1−α/2)(n−1)⎞⎠⎟<ρ.
Nel caso di un intervallo di confidenza del 99%, otteniamo per ρ = 1 e n = 5321 per ρ = 0,1 . Quest'ultimo caso produce un intervallo che è ( ancora! ) Del 10% grande quanto la stima puntuale della varianza.n=65ρ=1n=5321ρ=0.1
Se il livello di confidenza scelto è inferiore al 99%, verrà ottenuto lo stesso intervallo di larghezza per un valore inferiore di . Ma n potrebbe ancora essere più grande di quanto avresti immaginato.nn
Un grafico della dimensione del campione rispetto alla larghezza proporzionale ρ mostra qualcosa che appare asintoticamente lineare su una scala log-log; in altre parole, una relazione simile al potere-legge. Possiamo stimare il potere di questa relazione potere-legge (grossolanamente) comenρ
α^≈log0.1−log1log5321−log65=−log10log523165≈−0.525,
che purtroppo è decisamente lento!
Questo è una specie di caso "canonico" per darti un'idea di come procedere con il calcolo. Sulla base delle tue trame, i tuoi dati non sembrano particolarmente normali; in particolare, c'è quella che sembra essere una notevole asimmetria.
Ma questo dovrebbe darti un'idea di cosa aspettarsi. Nota che per rispondere alla tua seconda domanda sopra, è necessario prima fissare un livello di confidenza, che ho impostato al 99% nello sviluppo sopra a scopo dimostrativo.