Modello di regressione lineare che si adatta meglio ai dati con errori


9

Sto cercando l'algoritmo di regressione lineare più adatto per un dato la cui variabile indipendente (x) ha un errore di misurazione costante e la variabile dipendente (y) ha un errore dipendente dal segnale.

inserisci qui la descrizione dell'immagine

L'immagine sopra mostra la mia domanda.


1
Se la variabile costante x presenta un errore di misurazione costante e gli errori vengono utilizzati solo per ponderare le variabili in modo relativo, questa situazione non equivale a non avere errori in x?
pedrofigueira,

2
@pedro Questo non è il caso, perché gli errori in non sono semplicemente pesi in una formula. Con la regressione degli errori nelle variabili gli accoppiamenti differiranno e le stime di covarianza dei parametri differiranno dalla regressione ordinaria. x
whuber

1
Grazie per il chiarimento. Potresti espandere un po 'il motivo per cui è così?
pedrofigueira,

Risposte:


2

Errore di misurazione nella variabile dipendente

Dato un modello lineare generale con homosckedastic, non autocorrelato e non correlato con le variabili indipendenti, lascia che indichi la variabile "vera" e la sua misura osservabile. L'errore di misurazione è definito come la loro differenza Pertanto, il modello stimabile è: Poiché sono osservato, possiamo stimare il modello tramite OLS. Se l'errore di misurazione in è statisticamente indipendente da ciascuna variabile esplicativa, allora

(1)y=β0+β1x1++βkxk+ε
εyy
e=yy
(2)y=β0+β1x1++βkxk+e+ε
y,x1,,xky(e+ε)condivide le stesse proprietà di e sono valide le normali procedure di inferenza OLS ( statistiche, ecc.). Tuttavia, nel tuo caso mi aspetto una varianza crescente di . Puoi usare:εte
  • uno stimatore dei minimi quadrati ponderati (ad es. Kutner et al. , §11.1; Verbeek , §4.3.1-3);

  • lo stimatore OLS, che è ancora imparziale e coerente, e errori standard coerenti con l'eteroschedasticità, o semplicemente errori standard Wite ( Verbeek , §4.3.4).

Errore di misura nella variabile indipendente

Dato lo stesso modello lineare di cui sopra, lascia che denoti il ​​valore "vero" e sua misura osservabile. L'errore di misurazione è ora: Vi sono due situazioni principali ( Wooldridge , §4.4.2).xkxk

ek=xkxk
  • Cov(xk,ek)=0 : l'errore di misurazione non è correlato alla misura osservata e deve pertanto essere correlato alla variabile non osservata ; scrittura e collegare questo in (1): dal e entrambi sono correlate con ogni , compresi , misura solo aumenta la varianza degli errori e viola nessuna delle ipotesi OLS;xkxk=xkek

    y=β0+β1x1++βkxk+(εβkek)
    εexjxk
  • Cov(xk,ηk)=0 : l'errore di misurazione non è correlato alla variabile non osservata e deve quindi essere correlato alla misura osservata ; tale correlazione provoca prolem e la regressione OLS di su generalmente fornisce stimatori distorti e inconsistenti.xkyx1,,xk

Per quanto posso immaginare guardando la tua trama (errori centrati sui valori "veri" della variabile indipendente), si potrebbe applicare il primo scenario.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.