Sto eseguendo l'analisi dei dati esplorativi (EDA) su un set di dati. Quindi selezionerò alcune funzionalità per prevedere una variabile dipendente.
La domanda è:
devo fare l'EDA solo sul mio set di dati di addestramento? O dovrei unirmi ai set di dati di training e test insieme, quindi fare l'EDA su entrambi e selezionare le funzionalità in base a questa analisi?