Vorrei iniziare negando la premessa. Robert Geary probabilmente non ha esagerato con il caso quando ha detto (nel 1947) " ... la normalità è un mito; non c'è mai stata, e non ci sarà mai, una distribuzione normale " . - La
distribuzione normale è un modello *, un approssimazione che a volte è più o meno utile.
* (a proposito di ciò, vedi George Box , anche se preferisco la versione sul mio profilo).
Che alcuni fenomeni siano approssimativamente normali potrebbe non essere una grande sorpresa, dal momento che somme di effetti indipendenti [o anche non troppo fortemente correlati] dovrebbero, se ce ne sono molti e nessuno ha una varianza che è sostanziale rispetto alla varianza del somma del resto che potremmo vedere la distribuzione tende ad apparire più normale.
Il teorema del limite centrale (che riguarda la convergenza a una distribuzione normale di una media campione standardizzata come va all'infinito in alcune condizioni lievi) suggerisce almeno che potremmo vedere una tendenza verso quella normalità con dimensioni del campione sufficientemente grandi ma finite.n
Naturalmente se le medie standardizzate sono approssimativamente normali, le somme standardizzate lo saranno; questa è la ragione del ragionamento "somma di molti effetti". Quindi, se ci sono molti piccoli contributi alla variazione e non sono altamente correlati, potresti tendere a vederlo.
Il teorema di Berry-Esseen ci fornisce una dichiarazione al riguardo (convergenza verso le normali distribuzioni) che si sta effettivamente verificando con mezzi campione standardizzati per i dati iid (in condizioni leggermente più rigorose rispetto al CLT, poiché richiede che il terzo momento assoluto sia finito), come oltre a raccontarci quanto velocemente accade. Le versioni successive del teorema trattano componenti non identicamente distribuiti nella somma , sebbene i limiti superiori sulla deviazione dalla normalità siano meno rigorosi.
Meno formalmente, il comportamento delle convoluzioni con distribuzioni ragionevolmente buone ci fornisce ulteriori (sebbene strettamente correlati) motivi per sospettare che in molti casi possa essere una buona approssimazione in campioni finiti. La convoluzione agisce come una sorta di operatore di "sbavatura" che le persone che usano la stima della densità del kernel in una varietà di kernel avranno familiarità; una volta standardizzato il risultato (quindi la varianza rimane costante ogni volta che si esegue un'operazione del genere), si nota una progressione verso forme di collina sempre più simmetriche man mano che si lisciano ripetutamente (e non importa se si cambia il kernel ogni volta).
Terry Tao dà una bella discussione sulle versioni del teorema del limite centrale e del teorema di Berry-Esseen qui , e lungo la strada menziona un approccio a una versione non indipendente di Berry-Esseen.
Quindi c'è almeno una classe di situazioni in cui potremmo aspettarci di vederlo, e ragioni formali per pensare che tenderà realmente ad accadere in quelle situazioni. Tuttavia, nella migliore delle ipotesi il senso che il risultato di "somme di molti effetti" sia normale è un'approssimazione. In molti casi è un'approssimazione abbastanza ragionevole (e in altri casi anche se l'approssimazione della distribuzione non è vicina, alcune procedure che presuppongono la normalità non sono particolarmente sensibili alla distribuzione dei singoli valori, almeno in grandi campioni).
Ci sono molte altre circostanze in cui gli effetti non "aggiungono" e ci possiamo aspettare che accadano altre cose; ad esempio, in molti dati finanziari gli effetti tendono ad essere moltiplicativi (gli effetti sposteranno gli importi in termini percentuali, come interessi, inflazione e tassi di cambio, ad esempio). Lì non ci aspettiamo la normalità, ma a volte potremmo osservare un'approssimazione approssimativa della normalità sulla scala del registro. In altre situazioni nessuna delle due può essere appropriata, anche in senso approssimativo. Ad esempio, i tempi tra eventi generalmente non saranno ben approssimati né dalla normalità né dalla normalità dei registri; non ci sono "somme" né "prodotti" di effetti per cui discutere qui. Esistono numerosi altri fenomeni per i quali possiamo argomentare un particolare tipo di "legge" in circostanze particolari.