In un set di dati di due popolazioni non sovrapposte (pazienti e sani, totale ), vorrei trovare (su variabili indipendenti) predittori significativi per una variabile dipendente continua. La correlazione tra predittori è presente. Sono interessato a scoprire se qualcuno dei predittori è correlato alla variabile dipendente "in realtà" (piuttosto che prevedere la variabile dipendente il più esattamente possibile). Dato che sono stato sopraffatto dai numerosi possibili approcci, vorrei chiedere quale approccio sia maggiormente raccomandato.300
Dalla mia comprensione l'inclusione graduale o l'esclusione dei predittori non è raccomandata
Ad esempio eseguire una regressione lineare separatamente per ogni predittore e correggere i valori p per il confronto multiplo utilizzando FDR (probabilmente molto conservativo?)
Regressione dei componenti principali: difficile da interpretare in quanto non sarò in grado di parlare del potere predittivo dei singoli predittori, ma solo dei componenti.
altri suggerimenti?