Sto cercando l'algoritmo di regressione lineare più adatto per un dato la cui variabile indipendente (x) ha un errore di misurazione costante e la variabile dipendente (y) ha un errore dipendente dal segnale.
L'immagine sopra mostra la mia domanda.
Sto cercando l'algoritmo di regressione lineare più adatto per un dato la cui variabile indipendente (x) ha un errore di misurazione costante e la variabile dipendente (y) ha un errore dipendente dal segnale.
L'immagine sopra mostra la mia domanda.
Risposte:
Errore di misurazione nella variabile dipendente
Dato un modello lineare generale con homosckedastic, non autocorrelato e non correlato con le variabili indipendenti, lascia che indichi la variabile "vera" e la sua misura osservabile. L'errore di misurazione è definito come la loro differenza Pertanto, il modello stimabile è: Poiché sono osservato, possiamo stimare il modello tramite OLS. Se l'errore di misurazione in è statisticamente indipendente da ciascuna variabile esplicativa, allora
uno stimatore dei minimi quadrati ponderati (ad es. Kutner et al. , §11.1; Verbeek , §4.3.1-3);
lo stimatore OLS, che è ancora imparziale e coerente, e errori standard coerenti con l'eteroschedasticità, o semplicemente errori standard Wite ( Verbeek , §4.3.4).
Errore di misura nella variabile indipendente
Dato lo stesso modello lineare di cui sopra, lascia che denoti il valore "vero" e sua misura osservabile. L'errore di misurazione è ora: Vi sono due situazioni principali ( Wooldridge , §4.4.2).
: l'errore di misurazione non è correlato alla misura osservata e deve pertanto essere correlato alla variabile non osservata ; scrittura e collegare questo in (1): dal e entrambi sono correlate con ogni , compresi , misura solo aumenta la varianza degli errori e viola nessuna delle ipotesi OLS;
: l'errore di misurazione non è correlato alla variabile non osservata e deve quindi essere correlato alla misura osservata ; tale correlazione provoca prolem e la regressione OLS di su generalmente fornisce stimatori distorti e inconsistenti.
Per quanto posso immaginare guardando la tua trama (errori centrati sui valori "veri" della variabile indipendente), si potrebbe applicare il primo scenario.