Errori standard per coefficienti di regressione multipli?


18

Mi rendo conto che questa è una domanda molto semplice, ma non riesco a trovare una risposta da nessuna parte.

Sto calcolando i coefficienti di regressione usando le equazioni normali o la decomposizione QR. Come posso calcolare gli errori standard per ciascun coefficiente? Di solito penso che gli errori standard vengano calcolati come:

SEx¯ =σx¯n

Che cos'è per ciascun coefficiente? Qual è il modo più efficiente per calcolare questo nel contesto di OLS?σx¯

Risposte:


19

Quando si effettua la stima dei minimi quadrati (assumendo una normale componente casuale) le stime dei parametri di regressione sono normalmente distribuite con media uguale al parametro di regressione reale e matrice di covarianza Σ=s2(XTX)1 dove s2 è la varianza residua e XTX è la matrice del design. XT è la trasposizione di X e X è definita dall'equazione del modello Y=Xβ+ϵ con βi parametri di regressione e ϵ è il termine di errore. La deviazione standard stimata di un parametro beta viene ottenuta prendendo il termine corrispondente in (XTX)1 moltiplicandolo per la stima campionaria della varianza residua e quindi prendendo la radice quadrata. Questo non è un calcolo molto semplice ma qualsiasi pacchetto software lo calcolerà per te e lo fornirà nell'output.

Esempio

A pagina 134 di Draper e Smith (citati nel mio commento), forniscono i seguenti dati per il montaggio di minimi quadrati un modello dove ε N ( 0 , I σ 2 ) .Y=β0+β1X+εεN(0,Iσ2)

                      X                      Y                    XY
                      0                     -2                     0
                      2                      0                     0
                      2                      2                     4
                      5                      1                     5
                      5                      3                    15
                      9                      1                     9
                      9                      0                     0
                      9                      0                     0
                      9                      1                     9
                     10                     -1                   -10
                    ---                     --                   ---
Sum                  60                      5                    32
Sum of  Squares     482                     21                   528

Sembra un esempio in cui la pendenza dovrebbe essere vicina a 0.

Xt=(111111111102255999910).

Così

XtX=(nXiXiXi2)=(106060482)

e

(XtX)1=(Xi2n(XiX¯)2X¯(XiX¯)2X¯(XiX¯)21(XiX¯)2)=(48210(122)612261221122)=(0.3950.0490.0490.008)

dove .X¯=Xi/n=60/10=6

Stima per = (b0) = (Yb-b1 Xb) b1 Sxy / Sxxβ=(XTX)1XTY

b1 = 1/61 = 0,0163 e b0 = 0,5-0,0163 (6) = 0,402

Da sopra Sb1 = Se (0,008) e Sb0 = Se (0,395) dove Se è la deviazione standard stimata per il termine di errore. Se = √2.3085.(XTX)1

Mi dispiace che le equazioni non rechino le iscrizioni e le apice quando le ho tagliate e incollate. La tabella non si riproduceva bene neanche perché gli spazi venivano ignorati. La prima stringa di 3 numeri corrisponde ai primi valori di XY e XY e lo stesso per le stringhe followinf di tre. Dopo la somma arrivano rispettivamente le somme per XY e XY e poi la somma dei quadrati per XY e XY rispettivamente. Anche le matrici 2x2 sono state incasinate. I valori dopo le parentesi dovrebbero essere tra parentesi sotto i numeri a sinistra.


2
Non inteso come plug per il mio libro, ma passo attraverso i calcoli della soluzione dei minimi quadrati in semplice regressione lineare (Y = aX + b) e calcolo gli errori standard per aeb, pp.101-103, The Essentials of Biostatistics per medici, infermieri e clinici, Wiley 2011. Una descrizione più dettagliata è disponibile in Draper and Smith Applied Regression Analysis 3rd Edition, Wiley New York 1998 pagina 126-127. Nella mia risposta che segue prenderò un esempio da Draper e Smith.
Michael R. Chernick,

8
Quando ho iniziato a interagire con questo sito, Michael, ho provato sentimenti simili. Con esperienza, sono cambiati. Vale la pena conoscere un po 'di e una volta che lo fai, è (quasi) veloce digitarlo come digitare qualcosa in inglese. Ho anche imparato, studiando post esemplari (come molte risposte di @chl, cardinali e altri utenti per posta ad alta reputazione), che fornireriferimenti,illustrazionichiareedequazioniben ponderate disolito è molto apprezzato e bene ricevuto. L'alta qualità è una cosa che distingue questo sito dalla maggior parte degli altri. TEX
whuber

2
Questo è tutto bello Bill ed è bello che così tante persone si dedichino a dare messaggi di alta qualità. Posso usare Latex per altri scopi, come pubblicazioni su carta. Ma non ho tempo di dedicarmi a tutti gli sforzi che le persone si aspettano da me su questo sito. non investirò il tempo solo per fornire un servizio su questo sito.
Michael R. Chernick,

4
TEXTEX

3
Come molte delle persone qui, sì, lavoro come statistico, ma mi capita anche di trovarlo divertente - questo sito è ricreativo per me ed è un bel vantaggio che altri trovino utili alcuni dei miei post. Se trovi il markup delle tue equazioni conTEXessere lavoro e non pensare che valga la pena imparare, così sia, ma sappi che alcuni dei tuoi contenuti saranno trascurati.
Macro
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.