Nel contesto delle scienze sociali da cui provengo, il problema è se sei interessato a (a) previsione o (b) testare una domanda di ricerca focalizzata. Se lo scopo è la previsione, gli approcci basati sui dati sono appropriati. Se lo scopo è quello di esaminare una domanda di ricerca focalizzata, è importante considerare quale modello di regressione verifica specificamente la tua domanda.
Ad esempio, se il tuo compito era selezionare una serie di test di selezione per prevedere le prestazioni del lavoro, l'obiettivo può in un certo senso essere visto come uno di massimizzare la previsione delle prestazioni del lavoro. Pertanto, sarebbero utili approcci basati sui dati.
Al contrario, se si desidera comprendere il ruolo relativo delle variabili di personalità e delle variabili di abilità nell'influenzare le prestazioni, un approccio di confronto di modelli specifici potrebbe essere più appropriato.
In genere, quando si esplorano domande di ricerca mirate, l'obiettivo è chiarire qualcosa sui processi causali sottostanti che operano invece di sviluppare un modello con previsione ottimale.
Quando sono in procinto di sviluppare modelli di processo basati su dati trasversali, sarei diffidente nei confronti di: (a) compresi i predittori che teoricamente potrebbero essere considerati conseguenze della variabile risultato. Ad esempio, la convinzione di una persona di essere un buon esecutore è un buon predittore delle prestazioni lavorative, ma è probabile che ciò sia causato almeno in parte dal fatto di aver osservato le proprie prestazioni. (b) incluso un gran numero di predittori che riflettono tutti gli stessi fenomeni sottostanti. Ad esempio, compresi 20 articoli che misurano tutti la soddisfazione della vita in diversi modi.
Pertanto, le domande di ricerca mirate si basano molto di più sulla conoscenza specifica del dominio. Questo probabilmente spiega in qualche modo perché gli approcci basati sui dati sono meno usati nelle scienze sociali.