Lavoro nel campo del data mining e ho avuto pochissima istruzione formale in statistica. Ultimamente ho letto molto lavoro incentrato sui paradigmi bayesiani per l'apprendimento e il mining, che trovo molto interessanti.
La mia domanda è (in più parti), dato un problema esiste un quadro generale in base al quale è possibile costruire un modello statistico? Quali sono le prime cose che fai quando ti viene dato un set di dati di cui desideri modellare il processo sottostante? Ci sono buoni libri / tutorial là fuori che spiegano questo processo o è una questione di esperienza? L'inferenza è in primo piano nella tua mente quando costruisci il tuo modello o miri prima a descrivere i dati prima di preoccuparti di come usarli per il calcolo?
Qualsiasi approfondimento sarebbe molto apprezzato! Grazie.