Come si relazionano i residui ai disturbi sottostanti?


9

Nel metodo dei minimi quadrati vogliamo stimare i parametri sconosciuti nel modello:

Yj=α+βxj+εj(j=1...n)

Una volta che lo abbiamo fatto (per alcuni valori osservati), otteniamo la linea di regressione adattata:

Yj=α^+β^X+ej(j=1,...n)

Ora ovviamente vogliamo verificare alcuni grafici per garantire che le ipotesi siano soddisfatte. Supponiamo di voler verificare l'omoscedasticità, tuttavia, per fare ciò stiamo effettivamente controllando i residui . Supponiamo che tu esamini il diagramma dei valori residui vs previsti, se ciò ci dimostra che l'eteroscedasticità è evidente, allora come si collega al termine di disturbo ? L'eteroscedasticità nei residui implica eteroscedasticità in termini di disturbo? ejεj

Risposte:


3

Il modo più semplice per pensare a questo proposito è che i residui prime ( ) sono stime dei disturbi corrispondenti ( ). Tuttavia, ci sono alcune complessità extra. Ad esempio, sebbene nel modello OLS standard ipotizziamo che gli errori / i disturbi siano indipendenti, i residui non possono essere tutti. In generale, solo i residui possono essere indipendenti poiché si sono utilizzati i gradi di libertà nella stima del modello medio e i residui sono costretti a sommare aε j = e j N - p - 1 p - 1 0ej=yj-y^jε^j=ejN-p-1p-10. Inoltre, la deviazione standard dei residui grezzi non è effettivamente costante. In generale, la linea di regressione è adattata in modo tale che sarà mediamente più vicina a quei punti con maggiore leva. Di conseguenza, la deviazione standard dei residui per quei punti è inferiore a quella dei punti di leva bassi. (Per ulteriori informazioni, può essere utile leggere le risposte qui: Interpretazione di plot.lm () e / o qui: Come eseguire analisi residue per predittori binari / dicotomici indipendenti nella regressione lineare? )


3
Per chiarire, al massimo i residui di Np-1 possono essere indipendenti, ma in genere sono tutti correlati; invece, ci sono trasformazioni lineari di esse che possono avere componenti indipendenti Np-1.
Glen_b -Restate Monica

@Glen_b, buon punto.
gung - Ripristina Monica

8

Il rapporto tra ε e ε è:ε^ε

ε^=(io-H)ε

dove , la matrice cappello, è X ( X T X ) - 1 X T .HX(XTX)-1XT

Vale a dire che ε i è una combinazione lineare di tutti gli errori, ma tipicamente la maggior parte del peso cade sulla i uno -esimo.ε^ioio

Ecco un esempio, utilizzando il carsset di dati in R. Considera il punto contrassegnato in viola:

inserisci qui la descrizione dell'immagine

ioε^io0.98εio+Σjiowjεjwj

inserisci qui la descrizione dell'immagine

Possiamo riscriverlo come:

ε^io0.98εio+ηio

o più in generale

ε^io=(1-hioio)εio+ηio

hioioioHwjhioj

N(0,σ2)io

Vale a dire, in regressioni ben educate, i residui possono essere per lo più trattati come una stima moderatamente rumorosa di non osservabile il termine di errore. Considerando i punti più lontani dal centro, le cose funzionano in modo un po 'meno piacevole (il residuo diventa meno ponderato sull'errore e i pesi sugli altri errori diventano meno uniformi).

X


2
HεioH

nHn

np/np
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.