Perché viene utilizzato il chi quadrato quando si crea un intervallo di confidenza per la varianza?


15

Questa è una domanda molto semplice. Perché utilizziamo una distribuzione chi square? Qual è il significato di questa distribuzione? Perché questa distribuzione viene utilizzata per creare un intervallo di confidenza per la varianza?

Ogni posto in cui google per una spiegazione presenta semplicemente questo fatto, spiegando quando usare chi, ma non spiegando perché usare chi e perché appaia in questo modo.

Mille grazie a chiunque mi possa indirizzare verso la giusta direzione e cioè - capire veramente perché sto usando chi quando sto creando un intervallo di confidenza per la varianza.


4
Lo usi perché - quando i dati sono normali - Q=(n-1)S2σ2~χn-12 . (Questo rendeQuna quantità fondamentale)
Glen_b -Reststate Monica

2
Vedi anche stats.stackexchange.com/questions/15711/… e i suoi collegamenti.
Nick Cox,

1
Per coloro che sono interessati alle applicazioni di o ulteriori ricerche su χ2 , vorrai prestare attenzione alla distinzione tra una distribuzione χ2 ("chi-quadrato") e una distribuzione χ ("chi") (è il radice quadrata di χ2 , non a caso).
whuber

Risposte:


23

Risposta rapida

Il motivo è perché, supponendo che i dati siano iid e e che definiscano ˉ XXio~N(μ,σ2) quando si formano intervalli di confidenza, la distribuzione campionaria associata alla varianza del campione (S2, ricordate, una variabile casuale!) È una distribuzione chi-quadro (S2(N-1)/σ2χ2n-1), così come la distribuzione campionaria associata alla media campionaria è una distribuzione normale standard ((ˉX-μ)

X¯=ΣNXioNS2=ΣN(X¯-Xio)2N-1
S2S2(N-1)/σ2~χn-12) quando conosci la varianza e con uno studente t quando non lo conosci (( ˉ X -μ)(X¯μ)n/σZ(0,1) ).(X¯μ)n/STn1

Risposta lunga

Prima di tutto, proveremo che segue una distribuzione chi-quadro con N - 1 gradi di libertà. Successivamente, vedremo come questa dimostrazione sia utile quando si ricavano gli intervalli di confidenza per la varianza e come appare la distribuzione chi-quadro (e perché è così utile!). Cominciamo.S2(N1)/σ2N1

La prova

Per questo, forse devi abituarti alla distribuzione chi-quadro in questo articolo di Wikipedia . Questa distribuzione ha solo un parametro: i gradi di libertà, , e sembra avere una Moment Generating Function (MGF) data da: m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 . Se possiamo mostrare che la distribuzione di S 2 ( N - 1 ) / σ 2 ha una funzione generatrice di momenti come questa, ma con ν =ν

mχν2(t)=(12t)ν/2.
S2(N1)/σ2 , quindi abbiamo dimostrato che S 2 ( N - 1 ) / σ 2 segue una distribuzione chi-quadro con N - 1 gradi di libertà. Per dimostrarlo, nota due fatti:ν=N1S2(N-1)/σ2N-1
  1. Se definiamo, doveZiN(0,1), vale a dire variabili casuali normali standard, la funzione generatrice del momento diYè data da m Y (t)

    Y=Σ(Xio-X¯)2σ2=ΣZio2,
    Zio~N(0,1)Y Il MGF diZ2è dato da m Z 2 ( t )
    mY(t)=E[etY]=E[etZ12]×E[etZ22]×...E[etZN2]=mZio2(t)×mZ22(t)×...mZN2(t).
    Z2 dove ho usato il PDF dello standard normale,f(z)=e- z 2 / 2/
    mZ2(t)=-f(z)exp(tz2)dz=(1-2t)-1/2,
    e, quindi, mY(t)=(1-2t) - N / 2 , il cheimplica cheYsegue una distribuzione chi-quadro conNgradi di libertà.f(z)=ez2/2/2π
    mY(t)=(12t)N/2,
    YN
  2. Se e Y 2 sono indipendenti e ciascuno si distribuisce come distribuzione chi-quadro ma con ν 1 e ν 2 gradi di libertà, allora W = Y 1 + Y 2 si distribuisce con una distribuzione chi-quadrato con ν 1 + ν 2 gradi di libertà (questo deriva dal prendere l'MGF di W ; fallo!).Y1Y2ν1ν2W=Y1+Y2ν1+ν2W

Con i fatti di cui sopra, nota che se moltiplichi la varianza del campione per , ottieni (dopo un po 'di algebra), ( N - 1 ) S 2 = - n ( ˉ X - μ ) + ( X i - μ ) 2 , e quindi dividendo per σ 2 , ( N - 1 ) S 2N1

(N1)S2=n(X¯μ)+(Xiμ)2,
σ2 Si noti che il secondo termine nella parte sinistra di questa somma si distribuisce come distribuzione chi-quadro con 1 grado di libertà e la somma della parte destra si distribuisce come chi-quadrato conNgradi di libertà. Pertanto,S2(N-1)/σ2 sidistribuisce come un chi-quadrato conN-1gradi di libertà.
(N1)S2σ2+(X¯μ)2σ2/N=(Xiμ)2σ2.
NS2(N1)/σ2N1

Calcolo dell'intervallo di confidenza per la varianza.

Quando cerchi un intervallo di confidenza per la varianza, vuoi conoscere i limiti e L 2 in P ( L 1σ 2L 2 ) = 1 - α . Giochiamo con la disuguaglianza all'interno della parentesi. Innanzitutto, dividi per S 2 ( N - 1 ) , L 1L1L2

P(L1σ2L2)=1α.
S2(N1) E poi ricorda due cose: (1) la statisticaS2(N-1)/σ2ha una distribuzione chi-quadrato conN-1gradi di libertà e (2) le varianze sono sempre più grandi di zero, il che implica che tu può invertire le disuguaglianze, perché L 1
L1S2(N1)σ2S2(N1)L2S2(N1).
S2(N1)/σ2N1 quindi, la probabilità che stiamo cercando è: P(S2(N-1)
L1S2(N1)σ2S2(N1)S2(N1)σ2S2(N1)L1,σ2S2(N1)L2S2(N1)S2(N1)L2S2(N1)σ2,
P(S2(N1)L2S2(N1)σ2S2(N1)L1)=1α.
S2(N1)/σ2χ2(N1)
S2(N1)L2N1pχ2(x)dx=(1α)/2   ,N1S2(N1)L1pχ2(x)dx=(1α)/2  
N1N1N1
0S2(N1)L2pχ2(x)dx=α/2,S2(N1)L1pχ2(x)dx=α/2.
Calling χα/22=S2(N-1)L2 e χ1-α/22=S2(N-1)L1, dove i valori χα/22 e χ1-α/22 può essere trovato nelle tabelle chi-square (principalmente nei computer!) e risolvendo per L1 e L2,
L1=S2(N-1)χ1-α/22,L2=S2(N-1)χα/22.
Quindi, il tuo intervallo di confidenza per la varianza è
C.io.=(S2(N-1)χ1-α/22,S2(N-1)χα/22).

1
Semplicemente perchè S2 non segue una distribuzione chi-quadro centrata, mentre S2(N-1)/σ2fa e, quindi, è più facile lavorare con. Stai chiedendo una derivazione per quello? (cioè, vuoi che qualcuno te lo mostriS2(N-1)/σ2 segue una distribuzione chi-quadro con N-1gradi di libertà?)
Néstor il

4
Sarebbe utile modificare questa risposta per includere l' assunto molto forte ma non dichiarato che la varianza del campione segue una distribuzione chi-quadro quando i dati sottostanti sono indipendenti e seguono una distribuzione normale . A differenza della teoria della distribuzione della media del campione, dove in pratica la sua distribuzione del campionamento sarà approssimativamente normale a una ragionevole accuratezza in molte situazioni, questo stesso comportamento asintotico tende a non verificarsi con la varianza del campione (fino a quando le dimensioni del campione non diventano estremamente grandi).
whuber

1
Ops. Così vero! Questo in realtà è venuto da una soluzione del problema che ho distribuito ad alcuni studenti, in cui dichiaro sulla questione tutti questi presupposti. Ho modificato la risposta ora.
Néstor,

1
@ user34756 Il motivo per cui non utilizziamo la distribuzione di S2direttamente è che la sua distribuzione dipende dal valore di un parametro. Potresti trovare utile studiare l'uso di quantità cruciali nella costruzione di intervalli di confidenza.
Glen_b -Restate Monica

1
non è f(z)=e-z2/2 invece di f(z)=e-z2?
Benoît Legat,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.