Perché RSS distribuito chi square times np?


28

Vorrei capire perché, sotto il modello OLS, l'RSS (somma residua dei quadrati) è distribuito ( è il numero di parametri nel modello, il numero di osservazioni).p n

χ2(np)
pn

Mi scuso per aver posto una domanda così basilare, ma sembra che non riesca a trovare la risposta online (o nei miei libri di testo più orientati all'applicazione).


3
Si noti che le risposte dimostrano che l'affermazione non è del tutto corretta: la distribuzione di RSS è σ2 (non np ) volte una distribuzione χ2(np) dove σ2 è la vera varianza degli errori.
whuber

Risposte:


36

Considero il seguente modello lineare: y=Xβ+ϵ .

Il vettore dei residui è stimato da

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ

dove Q=IX(XX)1X .

Osserva che tr(Q)=np (la traccia è invariante sotto permutazione ciclica) e che Q=Q=Q2 . Gli autovalori di Q sono quindi 0 e 1 (alcuni dettagli di seguito). Quindi, esiste una matrice unitaria V tale che (le matrici sono diagonali dalle matrici unitarie se e solo se sono normali. )

VQV=Δ=diag(1,,1np times,0,,0p times)

Ora, lascia .K=Vϵ^

Dal momento che , abbiamo e quindi . cosìK~N(0,σ2Δ)Knϵ^N(0,σ2Q)KN(0,σ2Δ)Knp+1==Kn=0

K2σ2=K2σ2χnp2

con .K=(K1,,Knp)

Inoltre, poiché è una matrice unitaria, abbiamo ancheV

ϵ^2=K2=K2

così

RSSσ2χnp2

Infine, osserva che questo risultato lo implica

E(RSSnp)=σ2

Poiché , il polinomio minimo di divide il polinomio . Quindi, gli autovalori di sono tra e . Poiché è anche la somma degli autovalori moltiplicati per la loro molteplicità, abbiamo necessariamente che è un autovalore con molteplicità e zero è un autovalore con molteplicità .Q2Q=0Qz2zQ01tr(Q)=np1npp


1
(+1) Buona risposta. Si può limitare l'attenzione a ortogonale, anziché unitaria, poiché è reale e simmetrica. Inoltre, cos'è ? Non lo vedo definito. Riavviando leggermente l'argomento, si può anche evitare l'uso di una normale degenerata, nel caso in cui ciò causi una certa costernazione a coloro che non lo conoscono. VQSCR
cardinale il

2
@Cardinale. Buon punto. SCR ("Somme des Carrés Résiduels" in francese) avrebbe dovuto essere RSS.
Ocram,

Grazie per la risposta dettagliata Ocram! Alcuni passaggi mi richiedono di guardare di più, ma ho uno schema a cui pensare ora - grazie!
Tal Galili,

@Glen_b: Oh, ho apportato una modifica un paio di giorni fa per cambiare SCR in SRR. Non ricordavo che SCR fosse menzionato nel mio commento. Dispiace per la confusione.
Ocram,

@Glen_b: avrebbe dovuto significare RSS: -S modificato di nuovo. Thx
ocram,

9

IMHO, la notazione matriziale complica le cose. Il linguaggio dello spazio vettoriale puro è più pulito. Il modello può essere scritto Y = μ + σ G dove G ha la distribuzione normale standard su R n e si presume che μ appartenga a un sottospazio vettore W R n .Y=Xβ+ϵY=μ+σGGRnμWRn

Ora entra in gioco il linguaggio della geometria elementare. I minimi quadrati estimatore μ di μ è altro che P W Y : la proiezione ortogonale della osservabile Y sullo spazio W a cui μ è assunto appartenere. Il vettore dei residui è P W Y : proiezione sul complemento ortogonale W di W in R n . La dimensione di W è fioca ( W ) = n -μ^μPWYYWμPWYWWRnW .dim(W)=ndim(W)

Infine, e P W G ha la distribuzione normale standard su W , quindi la sua norma al quadrato ha la distribuzione χ 2 con dim ( W ) gradi di libertà.

PWY=PW(μ+σG)=0+σPWG,
PWGWχ2dim(W)

Questa dimostrazione usa solo un teorema, in realtà un teorema di definizione:

Definizione e teorema . Un vettore casuale in ha la distribuzione normale standard su uno spazio vettoriale U R n se prende i suoi valori in U e le sue coordinate in uno (RnURnUin tutto) le basi ortonormali di sono distribuzioni normali standard unidimensionali indipendentiU

(da questo teorema di definizione, il teorema di Cochran è così ovvio che non vale la pena dichiararlo)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.