Distribuzione normale multivariata del coefficiente di regressione?


12

Durante la lettura di un libro di testo sulla regressione ho riscontrato il seguente paragrafo:

La stima dei minimi quadrati di un vettore di coefficienti di regressione lineare ( ) èβ

β^=(XtX)1Xty

che, se considerato come una funzione dei dati y (considerando i predittori X come costanti), è una combinazione lineare dei dati. Utilizzando il Teorema del limite centrale, si può dimostrare che la distribuzione di β sarà approssimativamente multivariata normale se la dimensione del campione è grande.

Mi manca sicuramente qualcosa nel testo, ma non capisco come può un singolo valore avere una distribuzione? Come vengono generati i multipli valori per ottenere la distribuzione cui si fa riferimento nel testo?βββ


4
è il vettore dei coefficienti di regressione - chiarisce la confusione? β
Macro,

5
Quando si utilizza l'approccio dei minimi quadrati, si assume che sia fisso ma sconosciuto. Tuttavia, β , poiché è una funzione dei dati (casuale), ha una distribuzione. Asintoticamente la distribuzione è una distribuzione normale. Non asintoticamente, un coefficiente individuale sarà alla distribuzione. ββ^
Taylor,

7
Può essere utile osservare che è considerata una matrice costante nell'impostazione di regressione e che y è la realizzazione di una variabile casuale (valutata vettoriale). Quel po 'di CLT, tuttavia, non è del tutto corretto: si basa sul fatto che H abbia una certa struttura, che a volte non si verifica effettivamente con enormi set di dati, oppure su y stesso essendo multivariato normale (ma non è necessario invocare il CLT). H=(XtX)-1XtyHy
whuber

@Taylor Ma come fai a sapere la distribuzione di B se l'unica cosa che so è che la "dimensione del campione è grande"?
fino

2
@Taylor Il singolo componente del fattore beta avrà alla distribuzione solo se il componente di errore nel modello di regressione è gaussiano con 0 varianza media e costante. Nel caso non normale non si dovrebbe necessariamente conoscere la sua distribuzione sotto l'ipotesi nulla, ma potrebbe essere ancora asintoticamente normale. Tuttavia, come afferma whuber, il teorema del limite centrale potrebbe non reggere perché è una media ponderata e dobbiamo sapere che i pesi non si scontrano con la dimensione del campione in un modo che consente a pochi termini di dominare la somma.
Michael R. Chernick,

Risposte:


5

Non ha una distribuzione ma β , come indicato da Taylor. La distribuzione delle β deriva dal fatto che si ottiene diversi β per diversi campioni .--- Si può stimare questa distribuzione basata sulla singola β ricevuto dal singolo campione, a condizione di avere alcune informazioni relative alla distribuzione del dati sottostanti.ββ^β^β^β^

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.