Perché la distribuzione campionaria della varianza è una distribuzione chi-quadrata?


22

La dichiarazione

La distribuzione campionaria della varianza del campione è una distribuzione chi-quadrato con grado di libertà uguale a n1 , dove n è la dimensione del campione (dato che la variabile casuale di interesse è normalmente distribuita).

fonte

La mia intuizione

In un certo senso ha un senso intuitivo per me 1) perché un test chi-quadrato assomiglia a una somma di quadrato e 2) perché una distribuzione Chi-quadrato è solo una somma della distribuzione normale quadrata. Tuttavia, non ne ho una buona comprensione.

Domanda

L'affermazione è vera? Perché?


1
L'istruzione iniziale è falsa in generale (è falsa per due motivi separati). Qual è la tua fonte (manca il tuo link) e cosa dice in realtà?
Glen_b -Restate Monica,

La mia domanda arriva anche alla reazione a una domanda-risposta in una classe di statistiche introduttiva per la quale l'accesso è protetto. La domanda è "Quale distribuzione è la distribuzione campionaria della varianza nella lunghezza dell'ala nelle mosche?" e la risposta è "distribuzione Chi-quadrata"
Remi.b,

1
L'affermazione citata nel tuo primo commento è ancora falsa in generale. Il commento alla fine della fonte è vero (con i presupposti necessari): " quando i campioni di dimensione n sono presi da una distribuzione normale con varianza , la distribuzione campionaria di ( n - 1 ) s 2 / σ 2 ha una distribuzione chi-quadro con n-1 gradi di libertà.σ2(n1)s2/σ2 "... La risposta alla domanda nel tuo secondo commento sarà anche falsa - a meno che, suppongo, qualcuno abbia dimostrato che la lunghezza delle ali è normalmente distribuita. (Quali basi potrebbero esserci per affermare che ciò è vero?)
Glen_b -Reststate Monica

Supponiamo quindi che le ali siano normalmente distribuite, quindi la distribuzione campionaria di verrebbe distribuita al quadrato. Perché è così? (n1)s2/σ2
Remi.b,

Sei consapevole che una somma di quadrati di iid N (0,1) variabili casuali è chi-quadrato con k df? O è quella la parte di cui cerchi la prova? kk
Glen_b

Risposte:


27

[Presumo dalla discussione nella tua domanda che sei felice di accettare come fatto che se sono variabili casuali N ( 0 , 1 ) indipendenti identicamente distribuite , allora k i = 1 Z 2 iχ 2 k .]Zi,i=1,2,,kN(0,1)i=1kZi2χk2

Formalmente, il risultato di cui hai bisogno deriva dal teorema di Cochran . (Anche se può essere mostrato in altri modi)

Meno formalmente, considera che se conoscessimo la media della popolazione e ne stimassimo la varianza (piuttosto che sulla media del campione): , quindis 2 0 /σ2=1s02=1ni=1n(Xiμ)2s02/σ2=1ni=1n(Xiμσ)2=1ni=1nZi2Zi=(Xiμ)/σ1nχn2 random variable.

The fact that the sample mean is used, instead of the population mean (Zi=(XiX¯)/σ) makes the sum of squares of deviations smaller, but in just such a way that i=1n(Zi)2χn12 (about which, see Cochran's theorem). Hence, rather than ns02/σ2χn2 we now have (n1)s2/σ2χn12.


@Glen_b Can you give a reference for other proofs on this fact? I really want to know it.
Henry.L

Which of several facts are you after proof of?
Glen_b -Reinstate Monica

@Glen_b The only two methods besides Cochran-Madow Theorem of proving this fact that the sample variance and the sample mean is statistiacally independent with a chi-square distribution are:(1)Scheffe's canonical basis(Scheffe,1959)(2)Cumulant methods(Or mgfs, which is equivalent to it). If you know more methods, I really want to know them.
Henry.L

One more comment I want to add is that altough sample mean is used, but sometimes we want a fixed power independent of the fixed variance, this method is replaced by Stein's two-stage method(1949).
Henry.L

What I don't get about this answer, is that X¯ is not independent of all the Xis, so how can we apply Cochran's theorem? it says that they all need to be independent.
user56834
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.