La distribuzione normale sembra non intuitiva fino a quando non apprendi il CLT, il che spiega perché è così prevalente nella vita reale. Ma si presenta mai come la distribuzione "naturale" per una certa quantità?
La distribuzione normale sembra non intuitiva fino a quando non apprendi il CLT, il che spiega perché è così prevalente nella vita reale. Ma si presenta mai come la distribuzione "naturale" per una certa quantità?
Risposte:
In una certa misura penso che questo possa essere un problema filosofico tanto quanto statistico.
Molti fenomeni naturali sono distribuiti approssimativamente normalmente. Si può obiettare se la causa sottostante potrebbe essere qualcosa di simile al CLT:
Le altezze delle persone possono essere considerate come la somma di molte cause minori (forse indipendenti, improbabili distribuite in modo identico): lunghezze di varie ossa, o risultati di varie espressioni geniche, o risultati di molte influenze alimentari, o una combinazione di tutte le precedenti .
I punteggi dei test possono essere considerati come la somma dei punteggi di molte singole domande di test (possibilmente distribuite in modo identico, improbabilmente del tutto indipendenti).
Distanza che una particella percorre in una dimensione come risultato del movimento browniano in un fluido: il movimento può essere considerato astrattamente come una camminata casuale risultante da colpi casuali IID di molecole.
Un esempio in cui il CLT non è necessariamente coinvolto è la dispersione di colpi intorno a un occhio di bue: la distanza dall'occhio di bue può essere modellata come una distribuzione di Rayleigh (proporzionale alla radice quadrata di chi-sq con 2 DF) e l'angolo in senso antiorario da l'asse orizzontale positivo può essere modellato come uniforme suQuindi, dopo essere passati da coordinate polari a coordinate rettangolari, le distanze nelle direzioni orizzontale (x) e verticale (y) risultano normali non correlate bivariate. [Questa è l'essenza della trasformazione di Box-Muller, che puoi usare su Google.] Tuttavia, le normali coordinate xey potrebbero essere considerate come la somma di molte piccole imprecisioni nel targeting, il che potrebbe giustificare un meccanismo correlato al CLT in background .
In senso storico, l'uso diffuso di distribuzioni normali (gaussiane) invece di distribuzioni a doppia esponenziale (Laplace) per modellare osservazioni astronomiche può essere in parte dovuto al CLT. All'inizio della modellizzazione degli errori di tali osservazioni, c'è stato un dibattito tra Gauss e Laplace , ognuno dei quali sosteneva la propria distribuzione preferita. Per vari motivi, il modello normale ha vinto. Si può sostenere che una delle ragioni dell'eventuale successo della distribuzione normale era la convenienza matematica basata sui limiti normali del CLT. Questo sembra essere vero anche quando non è chiaro quale famiglia di distribuzioni fornisca la soluzione migliore. (Anche adesso, ci sono ancora astronomi che ritengono che "la migliore osservazione"fatto da un astronomo meticoloso e rispettato è destinato ad avere un valore migliore rispetto alla media di molte osservazioni fatte da presumibilmente meno dotati osservatori. In effetti, preferirebbero non intervenire affatto da parte degli statistici.)
Molte variabili presenti in natura sono normalmente distribuite. Altezze degli umani? Dimensione delle colonie animali?
rnorm(1)
. Lo stesso con tutte le distribuzioni, ad eccezione del multinomiale.