L'analisi dei dati esplorativi (EDA) spesso porta ad esplorare altre "tracce" che non appartengono necessariamente alla serie iniziale di ipotesi. Devo affrontare una situazione del genere nel caso di studi con una dimensione del campione limitata e molti dati raccolti attraverso diversi questionari (dati socio-demografici, scale neuropsicologiche o mediche - ad esempio, funzionamento mentale o fisico, livello di depressione / ansia, lista di controllo dei sintomi ). Succede che l'EDA aiuti ad evidenziare alcune relazioni inattese ("inattese" nel senso che non sono state incluse nel piano di analisi iniziale) che si traducono in ulteriori domande / ipotesi.
Come nel caso del sovradimensionamento, il dragaggio o lo snoop dei dati porta a risultati che non si generalizzano. Tuttavia, quando sono disponibili molti dati, è abbastanza difficile (per il ricercatore o il medico) postulare una serie limitata di ipotesi.
Vorrei sapere se esistono metodi, raccomandazioni o regole empiriche ben noti che possono aiutare a delineare l'EDA nel caso di studi su piccoli campioni.