Questa domanda fa riferimento al documento di Galit Shmueli "Spiegare o predire" .
Nello specifico, nella sezione 1.5, "Spiegazione e previsione sono diverse", il professor Shmueli scrive:
Nella modellistica esplicativa l'attenzione si concentra sulla minimizzazione della distorsione per ottenere la rappresentazione più accurata della teoria sottostante.
Questo mi ha lasciato perplesso ogni volta che ho letto il giornale. In che senso minimizzare la distorsione nelle stime fornisce la rappresentazione più accurata della teoria sottostante?
Ho anche visto il discorso del professor Shmueli qui , tenuto al JMP Discovery Summit 2017, e afferma:
... cose che sono modelli di contrazione, complessi, non li vedrai mai. Perché tali modelli, in base alla progettazione, introducono distorsioni al fine di ridurre la distorsione / varianza complessiva. Ecco perché non ci saranno, non ha senso teorico farlo. Perché dovresti rendere il tuo modello distorto di proposito?
Questo non fa davvero luce sulla mia domanda, semplicemente riaffermando l'affermazione che non capisco.
Se la teoria ha molti parametri e abbiamo scarsi dati per stimarli, l'errore di stima sarà dominato dalla varianza. Perché sarebbe inappropriato utilizzare una procedura di stima distorta come la regressione della cresta (risultante in stime distorte della varianza inferiore) in questa situazione?