Ci penserò anche se non sono uno statistico, ma finisco per fare un sacco di "modellistica" - statistica e non statistica.
Innanzitutto cominciamo con le basi:
Cos'è esattamente un modello?
Un modello è una rappresentazione della realtà seppur altamente semplificata. Pensa a un "modello" di cera / legno per una casa. Puoi toccarlo / sentirlo / annusarlo. Ora un modello matematico è una rappresentazione della realtà usando i numeri.
Cos'è questa "realtà" che ti sento chiedere? Va bene. Pensa quindi a questa semplice situazione: il governatore del tuo stato attua una politica secondo la quale il prezzo di un pacchetto di sigarette costerebbe ora $ 100 per il prossimo anno. L '"obiettivo" è dissuadere le persone dall'acquistare sigarette, riducendo così il fumo e rendendo i fumatori più sani (perché avevano smesso).
Dopo 1 anno il governatore ti chiede: è stato un successo? Come puoi dirlo? Bene, acquisisci dati come il numero di pacchetti venduti / giorno o all'anno, risposte al sondaggio, tutti i dati misurabili su cui puoi mettere le mani rilevanti per il problema. Hai appena iniziato a "modellare" il problema. Ora vuoi analizzare ciò che dice questo "modello" . È qui che la modellistica statistica è utile. È possibile eseguire un semplice diagramma di correlazione / dispersione per vedere l'aspetto del modello. Potresti avere la fantasia di determinare la causalità, ad esempio se l'aumento del prezzo ha portato a una diminuzione del fumo o ci sono stati altri fattori di confusione in gioco (cioè, forse è qualcos'altro del tutto e il tuo modello l'ha mancato forse?).
Ora, la costruzione di questo modello è fatta da un "insieme di regole" (più simili alle linee guida), cioè cosa è / non è legale o cosa ha / non ha senso. Dovresti sapere cosa stai facendo e come interpretare i risultati di questo modello. Costruire / eseguire / interpretare questo modello richiede una conoscenza di base delle statistiche. Nell'esempio sopra è necessario conoscere i grafici di correlazione / dispersione, la regressione (uni e multivariata) e altre cose. Suggerisco di leggere in modo intuitivo la lettura assolutamente divertente / informativa sulla comprensione delle statistiche: Che cos'è un valore p comunque È un'introduzione divertente alle statistiche e ti insegnerà 'modellando' lungo il percorso dal semplice all'avanzato (cioè la regressione lineare). Quindi puoi continuare e leggere altre cose.
Quindi, ricorda che un modello è una rappresentazione della realtà e che "Tutti i modelli sono sbagliati ma alcuni sono più utili di altri" . Un modello è una rappresentazione semplificata della realtà e non puoi assolutamente considerare tutto ma devi sapere cosa fare e cosa non considerare per avere un buon modello in grado di darti risultati significativi.
Non si ferma qui. Puoi creare modelli per simulare anche la realtà! Ecco come un mucchio di numeri cambierà nel tempo (diciamo). Questi numeri corrispondono a un'interpretazione significativa nel tuo dominio. Puoi anche creare questi modelli per estrarre i tuoi dati per vedere come le varie misure si relazionano tra loro (l'applicazione delle statistiche qui potrebbe essere discutibile, ma per ora non preoccuparti). Esempio: guardi le vendite di generi alimentari per un negozio al mese e ti rendi conto che ogni volta che la birra viene acquistata lo è anche un pacchetto di pannolini (costruisci un modello che attraversa il set di dati e ti mostra questa associazione). Può essere strano ma può implicare che per lo più i padri lo acquistano nel fine settimana quando fanno da baby-sitter ai loro figli? Metti i pannolini vicino alle birre e potresti aumentare le tue vendite! Aaah! Modellazione :)
Questi sono solo esempi e non sono affatto un riferimento per il lavoro professionale. Fondamentalmente costruisci modelli per capire / stimare come funzionerà / funzionerà la realtà e per prendere decisioni migliori in base ai risultati. Statistiche o no, probabilmente hai fatto il modello per tutta la vita senza rendertene conto. Buona fortuna :)