Ci sono esempi di una variabile normalmente distribuita che * non * è dovuta al teorema del limite centrale?


11

La distribuzione normale sembra non intuitiva fino a quando non apprendi il CLT, il che spiega perché è così prevalente nella vita reale. Ma si presenta mai come la distribuzione "naturale" per una certa quantità?


4
La teoria fisica della diffusione, nella misura in cui è applicabile a qualsiasi sistema, prevede distribuzioni normali di quantità (come temperatura o concentrazione) che hanno origine in un punto. In effetti, molti sistemi sono diffusivi (prezzi delle opzioni, trasporto di particelle in media omogenei, ecc.), Suggerendo che gli esempi sono abbondanti supponendo che uno non sia così ingenuo da supporre che una distribuzione normale debba resistere esattamente a valori grandi o piccoli irrealisticamente - sarebbe un fraintendimento di tutta la teoria fisica.
whuber

2
La distribuzione normale sembra non intuitiva fino a quando non si impara che massimizza l'entropia sotto il vincolo della varianza fissa.
leonbloy,

Risposte:


11

In una certa misura penso che questo possa essere un problema filosofico tanto quanto statistico.

Molti fenomeni naturali sono distribuiti approssimativamente normalmente. Si può obiettare se la causa sottostante potrebbe essere qualcosa di simile al CLT:

  • Le altezze delle persone possono essere considerate come la somma di molte cause minori (forse indipendenti, improbabili distribuite in modo identico): lunghezze di varie ossa, o risultati di varie espressioni geniche, o risultati di molte influenze alimentari, o una combinazione di tutte le precedenti .

  • I punteggi dei test possono essere considerati come la somma dei punteggi di molte singole domande di test (possibilmente distribuite in modo identico, improbabilmente del tutto indipendenti).

  • Distanza che una particella percorre in una dimensione come risultato del movimento browniano in un fluido: il movimento può essere considerato astrattamente come una camminata casuale risultante da colpi casuali IID di molecole.

Un esempio in cui il CLT non è necessariamente coinvolto è la dispersione di colpi intorno a un occhio di bue: la distanza dall'occhio di bue può essere modellata come una distribuzione di Rayleigh (proporzionale alla radice quadrata di chi-sq con 2 DF) e l'angolo in senso antiorario da l'asse orizzontale positivo può essere modellato come uniforme suQuindi, dopo essere passati da coordinate polari a coordinate rettangolari, le distanze nelle direzioni orizzontale (x) e verticale (y) risultano normali non correlate bivariate. [Questa è l'essenza della trasformazione di Box-Muller, che puoi usare su Google.] Tuttavia, le normali coordinate xey potrebbero essere considerate come la somma di molte piccole imprecisioni nel targeting, il che potrebbe giustificare un meccanismo correlato al CLT in background .(0,2π).

In senso storico, l'uso diffuso di distribuzioni normali (gaussiane) invece di distribuzioni a doppia esponenziale (Laplace) per modellare osservazioni astronomiche può essere in parte dovuto al CLT. All'inizio della modellizzazione degli errori di tali osservazioni, c'è stato un dibattito tra Gauss e Laplace , ognuno dei quali sosteneva la propria distribuzione preferita. Per vari motivi, il modello normale ha vinto. Si può sostenere che una delle ragioni dell'eventuale successo della distribuzione normale era la convenienza matematica basata sui limiti normali del CLT. Questo sembra essere vero anche quando non è chiaro quale famiglia di distribuzioni fornisca la soluzione migliore. (Anche adesso, ci sono ancora astronomi che ritengono che "la migliore osservazione"fatto da un astronomo meticoloso e rispettato è destinato ad avere un valore migliore rispetto alla media di molte osservazioni fatte da presumibilmente meno dotati osservatori. In effetti, preferirebbero non intervenire affatto da parte degli statistici.)


Sì. Correggi ancora errori di battitura. Grazie per aver notato questo. Risolto anche lo stesso errore nei "punteggi dei test".
BruceET,

-3

Molte variabili presenti in natura sono normalmente distribuite. Altezze degli umani? Dimensione delle colonie animali?


1
@Happy In realtà nessuno degli esempi qui riportati è normalmente distribuito perché il supporto della distribuzione normale è -infinito a + infinito e gli esempi forniti non possono mai essere zero o inferiori. In ogni caso, la distribuzione normale potrebbe essere un'approssimazione utile, ma non se tu fossi interessato alle code della distribuzione.
JeremyC,

2
L'altezza umana è il risultato della somma di (approssimativamente) geni indipendenti, quindi in realtà sono dovuti al CLT.
gardenhead

2
@ArtemMavrin: ottenere un'altezza negativa sarebbe qualcosa come 8+ deviazioni standard. Se uno si oppone a un'approssimazione normale non valida perché posiziona una massa di probabilità zero oltre le 8 sd, si potrebbe anche lamentare che un valore veramente Normalmente distribuito è irrazionale con la probabilità 1, tuttavia tutte le nostre misurazioni sono numeri razionali.
Cliff AB,

1
@ArtemMavrin: bene, se la domanda è qualcosa di esattamente distribuito normalmente, quella risposta è semplice: no. Nemmeno rnorm(1). Lo stesso con tutte le distribuzioni, ad eccezione del multinomiale.
Cliff AB,

2
@gardenhead ha letto l'affermazione del teorema del limite centrale e nota dove non corrisponde a quello che hai detto (il numero di geni è finito mentre CLT riguarda la distribuzione limitante di una somma standardizzata da . a proposito, c'è un altro teorema che dice che una somma finita di iid variate non normali non può essere normale; questo teorema non contraddice l'attuale CLT!)n
Glen_b -Restate Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.