Perché i gradi di libertà per coppie abbinate -test il numero di coppie meno 1?


9

Sono abituato a conoscere i "gradi di libertà" come , dove hai il modello lineare \ mathbf {y} = \ mathbf {X} \ boldsymbol {\ beta} + \ boldsymbol {\ epsilon} con \ mathbf {y } \ in \ mathbb {R} ^ n , \ mathbf {X} \ in M_ {n \ times p} (\ mathbb {R}) la matrice di progettazione con rango r , \ boldsymbol {\ beta} \ in \ mathbb { R} ^ p , \ boldsymbol {\ epsilon} \ in \ mathbb {R} ^ n con \ boldsymbol {\ epsilon} \ sim \ mathcal {N} (\ mathbf {0}, \ sigma ^ 2 \ mathbf {I} _n) , \ sigma ^ 2> 0 .nr

y=Xβ+ϵ
yRnXMn×p(R)rβRpϵRnϵN(0,σ2In)σ2>0

Da ciò che ricordo delle statistiche elementari (vale a dire modelli pre-lineari con algebra lineare), i gradi di libertà per il test t di coppie abbinate tè il numero di differenze meno 1 . Quindi ciò implicherebbe che X abbia il grado 1, forse. È corretto? In caso contrario, perché n1 il grado di libertà per il test t delle coppie abbinate t?

Per capire il contesto, supponiamo di avere un modello a effetti misti

yijk=μi+ some random effects+eijk
dove i=1,2 , j=1,,8 e k=1,2 . Non c'è niente di speciale in μi diverso da quello che è un effetto fisso, ed eijkiidN(0,σe2) . Suppongo che gli effetti casuali siano irrilevanti per questo problema, poiché in questo caso ci preoccupiamo solo degli effetti fissi.

Vorrei fornire un intervallo di confidenza per μ1μ2 .

Ho già dimostrato che d¯=18dj è uno stimatore imparziale di μ1μ2 , dove dj=y¯1jy¯2j , y¯1j=12ky1jk e y¯21 è definito in modo simile. La stima del punto d¯ è stata calcolata.

Ho già dimostrato che

sd2=j(djd¯)281
è uno stimatore imparziale della varianza di dj e pertanto,
sd28
è l'errore standard di d¯ . Questo è stato calcolato.

Ora l'ultima parte è capire i gradi di libertà. Per questo passaggio, di solito cerco di trovare la matrice di progettazione - che ovviamente ha il grado 2 - ma ho la soluzione a questo problema e dice che i gradi di libertà sono .81

Nel contesto della ricerca del rango di una matrice di design, perché i gradi di libertà sono ?81

Modificato per aggiungere: forse utile in questa discussione è come viene definita la statistica del test. Supponiamo di avere un parametro parametro . In questo caso, (a meno che non mi manchi qualcosa del tutto). Stiamo essenzialmente eseguendo il test di ipotesi dove . Quindi, la statistica del test è data da che verrebbe testato contro una distribuzione centrale conβ

β=[μ1μ2]
cβ=0
c=[11]
t=cβ^σ^2c(XX)1c
tnrgradi di libertà, dove è la matrice di progettazione come sopra e dove .X
σ^2=y(IPX)ynr
PX=X(XX)1X

Risposte:


5

Il test coppie abbinate con coppie è in realtà solo un test per un campione con un campione di dimensione . Hai differenze e queste sono iid e normalmente distribuite. La prima colonna dopo hatntnnd1,,dn

[d1dn]=[d¯d¯]+[d1d¯d1d¯]n d.f.1 d.f.(n1) d.f.
=''1grado di libertà a causa del vincolo lineare che dice che tutte le voci sono uguali; il secondo ha gradi di libertà a causa del vincolo lineare che dice che la somma delle voci è .n10

Quindi, in altre parole, il motivo per cui abbiamo gradi di libertà qui non ha nulla a che fare con il modello lineare ? n1y=Xβ+ϵ
Clarinetto

1
Essa ha a che fare con quel modello, dove la matrice è una colonna di s e è un matrice la cui unica voce è la differenza tra le due medie della popolazione. X1β1×1
Michael Hardy

2
Aha! Quindi il tuo sarebbe quel vettore di s, giusto? Grazie mille! Non riesco a credere quanto sia stato difficile trovare una risposta su questo! ydi
Clarinetist

Sì. È il vettore delle differenze osservate nelle coppie accoppiate. n
Michael Hardy

2

Mille grazie a Michael Hardy per aver risposto alla mia domanda.

L'idea è questa: let e . Quindi il nostro modello lineare è quindi dove è il vettore di tutti e Ovviamente ha il grado , quindi abbiamo gradi di libertà .

y=[d1dn]
β=[μ1μ2]
y=1n×1β+ϵ
1n×1n
ϵ=[ϵ1ϵn]N(0,σ2In).
X=1n×11n1

Come facciamo a sapere che uguale a ? Ricordiamo che e come si può facilmente vedere, per tutti . Dato il nostro , è ovvio quale dovrebbe essere . Questo è perché β[μ1μ2]

E[y]=Xβ
E[dj]=μ1μ2jXβ
E[y]=E[[d1dn]]=[E[d1]E[dn]]=[μ1μ2μ1μ2]=Xβ=1n×1β=[11]β
so dovrebbe essere una matrice con .β1×1β=[μ1μ2]

Impostare . Quindi il nostro test di ipotesi è La nostra statistica di test è quindi Abbiamo Dopo alcuni lavori, si può dimostrare che Si può anche dimostrare chec=[1]

H0:cβ=0.
cβ^σ^2c(XX)1c.
σ^2=y(IPX)ynr(X).
PX=P1n×1=1n×1(1n)1.
IPXè simmetrico e idempotente. Quindi, e
σ^2=y(IPX)ynr(X)=y(IPX)(IPX)ynr(X)=(IPX)y2nr(X)=[I1n×1(1n)1]y2n1=[d1dn][d¯d¯]2n1=i=1n(did¯)2n1=sd2
XX=1n×11n×1=n
che ovviamente ha inversa , fornendo così una statistica di prova che verrebbe testata su una distribuzione centrale con gradi di libertà come desiderato.1/n
μ^1μ^2sd2/n
tn1
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.