Poiché
sappiamo che
e quindi sappiamo che per ogni componente di ,
dove è l' elemento diagonale di . Quindi, sappiamo che
β^=(XTX)−1XTY=(XTX)−1XT(Xβ+ε)=β+(XTX)−1XTε
β^−β∼N(0,σ2(XTX)−1)
kβ^β^k−βk∼N(0,σ2Skk)
Skkkth(XTX)−1zk=β^k−βkσ2Skk−−−−−√∼N(0,1).
Prendi nota dell'affermazione del Teorema per la distribuzione di una forma quadratica idempotente in un vettore normale standard (Teorema B.8 in Greene):
Se e è simmetrica e idempotente, allora è distribuito dove è la posizione di .x∼N(0,I)AxTAxχ2ννA
Sia denota il vettore residuo di regressione e sia
che è la matrice del creatore residuo (ovvero ) . È facile verificare che sia simmetrico e idempotente .ε^
M=In−X(XTX)−1XT,
My=ε^M
Lascia che
sia uno stimatore per .
s2=ε^Tε^n−p
σ2
Dobbiamo quindi fare un po 'di algebra lineare. Nota queste tre proprietà di algebra lineare:
- Il rango di una matrice idempotente è la sua traccia.
- Tr(A1+A2)=Tr(A1)+Tr(A2)
- Tr(A1A2)=Tr(A2A1) se è e è ( questa proprietà è fondamentale per il funzionamento di seguito )A1n1×n2A2n2×n1
Quindi
rank(M)=Tr(M)=Tr(In−X(XTX)−1XT)=Tr(In)−Tr(X(XTX)−1XT))=Tr(In)−Tr((XTX)−1XTX))=Tr(In)−Tr(Ip)=n−p
Quindi
V=(n−p)s2σ2=ε^Tε^σ2=(εσ)TM(εσ).
Applicando il teorema per la distribuzione di una forma quadratica idempotente in un vettore normale standard (indicato sopra), sappiamo che .V∼χ2n−p
Dato che hai presupposto che sia normalmente distribuito, allora è indipendente da e poiché è una funzione di , allora è anche indipendente da . Pertanto, e sono indipendenti l'uno dall'altro.εβ^ε^s2ε^s2β^zkV
Quindi,
è il rapporto di una distribuzione normale standard con la radice quadrata di una distribuzione Chi-quadrata con gli stessi gradi di libertà (cioè ), che è una caratterizzazione della distribuzione . Pertanto, la statistica ha una distribuzione con gradi di libertà.
tk=zkV/(n−p)−−−−−−−−√
n−pttktn−p
Può quindi essere manipolato algebricamente in una forma più familiare.
tk=β^k−βkσ2Skk√(n−p)s2σ2/(n−p)−−−−−−−−−−−−√=β^k−βkSkk√s2−−√=β^k−βks2Skk−−−−−√=β^k−βkse(β^k)