Supponiamo di voler stimare un modello:
dove sono medie o tassi pro capite per regioni o zone geografiche, quindi se è la variabile aggregata di interesse regionale e è la popolazione:Z i P i
Se tutte le variabili sono misurate accuratamente e se esistono e tali che per tutti i:
quindi la stima OLS del modello (1) dovrebbe produrre una stima imparziale di .
Supponiamo tuttavia che le stime di siano solo approssimative. Questo è in pratica probabilmente poiché i valori di saranno quasi sicuramente ottenuti o derivati dai dati del censimento, portando a diverse possibili fonti di errore:
- errore nei dati del censimento originale;
- estrapolazione dai dati del censimento utilizzando ipotesi sull'andamento della popolazione in cui sono richiesti dati per una data successiva;
- le regioni utilizzate nel modello potrebbero non corrispondere alle aree del censimento, ad esempio anelli concentrici attorno a un punto centrale. Un esempio è uno studio di valutazione dei costi di viaggio riportato in Herath (1999) (1) in cui le popolazioni nell'intervallo da 5.000 a 35.000 per zone ad anello concentrico sono tutte espresse in multipli esatti di 5.000, suggerendo che le cifre sono solo molto approssimative.
Gli errori in ovviamente "infetteranno" i valori di , ma non in modo semplice, poiché l'effetto assoluto su di un dato errore in dipenderà dalla dimensione di (e se non ci sarà errore in ).
Domanda : dati gli errori in , la stima OLS del modello (1) produrrà una stima imparziale di e, in caso contrario, in quali condizioni aggiuntive la stima sarebbe imparziale?
Riferimento
- Herath, G (1999) Stima dei valori comunitari dei laghi: uno studio sul lago Mokoan nella Victoria Australia Analisi economica e politica 29 (1) Tabella 1 p 37