Per capire il motivo per cui si usa il t-distribuzione, è necessario sapere che cosa è la distribuzione di fondo di β e della somma dei quadrati dei residui ( R S S ) come questi due messi insieme vi darà la distribuzione t.βˆRSS
La parte più semplice è la distribuzione di β che è una distribuzione normale - a questa nota che β = ( X T X ) - 1 X T Y è quindi una funzione lineare di Y , dove Y ~ N ( X β , σ 2 I n ) . Come risultato è anche distribuito normalmente, β ~ N ( β , σ 2 ( X T X ) -βˆβˆ(XTX)−1XTYYY∼N(Xβ,σ2In)- fatemi sapere se avete bisogno di aiuto derivante la distribuzione di β .βˆ∼N(β,σ2(XTX)−1)βˆ
Inoltre, , dove n è il numero di osservazioni e p è il numero di parametri utilizzati nella regressione. La prova di ciò è un po 'più complessa, ma anche semplice da ricavare (vedi la prova qui Perché l'RSS è distribuito chi square times np? ).RSS∼σ2χ2n−pnp
Fino a questo punto ho considerato tutto nella matrice / vettore di notazione, ma cerchiamo di semplicità d'uso β ho e utilizzare la sua distribuzione normale, che ci
darà: β I - β iβˆi
βˆi−βiσ(XTX)−1ii−−−−−−−−√∼N(0,1)
Inoltre, dalla distribuzione chi-quadrato di abbiamo che:
( n - p ) s 2RSS
(n−p)s2σ2∼χ2n−p
Questo era semplicemente un riarrangiamento della prima espressione chi-quadrata ed è indipendente da . Inoltre, definiamo s 2 = R S SN(0,1) , che è uno stimatore imparziale perσ2. Con la definizione della definizionetn-pche dividendo una distribuzione normale per un chi-quadrato indipendente (oltre i suoi gradi di libertà) si ottiene una distribuzione t (per la prova vedi:una normale divisa per√s2=RSSn−pσ2tn−p ti dà una distribuzione t - provaχ2(s)/s−−−−−−√) ottieni che:
βˆi−βis(XTX)−1ii−−−−−−−−√∼tn−p
s(XTX)−1ii−−−−−−−−√=SE(βˆi)
Fammi sapere se ha senso.