Attualmente sto lavorando a un problema in cui abbiamo un piccolo set di dati e siamo interessati all'effetto causalità di un trattamento sul risultato.
Il mio consulente mi ha incaricato di eseguire una regressione univariata su ciascun predittore con il risultato come risposta, quindi l'assegnazione del trattamento come risposta. Cioè, mi viene chiesto di adattare una regressione con una variabile alla volta e di fare una tabella dei risultati. Ho chiesto "perché dovremmo farlo?", E la risposta è stata qualcosa per l'effetto di "siamo interessati a quali predittori sono associati con l'assegnazione del trattamento e il risultato, poiché ciò indicherebbe probabilmente un confondente". Il mio consulente è un esperto di statistica, non uno scienziato in un altro campo, quindi sono propenso a fidarmi di loro.
Ciò ha senso, ma non è chiaro come utilizzare il risultato dell'analisi univariata. Fare delle scelte di selezione del modello da questo risultato non determinerebbe una distorsione significativa delle stime e intervalli di confidenza ristretti? Perché qualcuno dovrebbe farlo? Sono confuso e il mio consulente è abbastanza opaco sulla questione quando l'ho sollevato. Qualcuno ha risorse su questa tecnica?
(NB: il mio advisor ha detto che NON stiamo usando i valori p come valore limite, ma che vogliamo considerare "tutto".)