Ho avuto in passato una serie di domande su di me riguardanti articoli pubblicati in diverse aree in cui regressioni (e modelli correlati, come modelli di pannelli o GLM) sono utilizzati su dati osservativi (ovvero dati non prodotti da esperimenti controllati , in molti casi - ma non sempre - dati osservati nel tempo) ma in cui non viene fatto alcun tentativo di introdurre variabili strumentali.
In risposta ho espresso una serie di critiche (come la descrizione di problemi con distorsioni quando possono mancare variabili importanti) ma dal momento che altre persone qui saranno senza dubbio molto più consapevoli di me su questo argomento, ho pensato che avrei chiesto:
Quali sono i principali problemi / conseguenze del tentativo di trarre conclusioni sulle relazioni (in particolare, ma non limitato a conclusioni causali) in tali situazioni?
Si può fare qualcosa di utile con studi che si adattano a tali modelli in assenza di strumenti?
Quali sono alcuni buoni riferimenti (libri o documenti) sui problemi con tale modellistica (preferibilmente con chiara motivazione non tecnica delle conseguenze, dal momento che di solito le persone che chiedono hanno una varietà di sfondi, alcuni senza molte statistiche) a cui le persone potrebbero fare riferimento nella critica un documento? Sarebbe utile anche la discussione di precauzioni / problemi con gli strumenti.
(I riferimenti di base sulle variabili strumentali sono qui , anche se se ne hai bisogno, sarebbe utile anche questo.)
Puntare a buoni esempi pratici di ricerca e uso degli strumenti sarebbe un vantaggio, ma non è centrale per questa domanda.
[Probabilmente indicherò altre buone risposte qui quando tali domande mi vengono in mente. Posso aggiungere uno o due esempi man mano che li ottengo.]