Sembri presumere nella tua domanda che il concetto di distribuzione normale esistesse prima che la distribuzione fosse identificata e la gente cercasse di capire di cosa si trattasse. Non mi è chiaro come funzionerebbe. [Modifica: c'è almeno un senso che potremmo considerare ci sia una "ricerca di una distribuzione" ma non è "una ricerca di una distribuzione che descriva molti e molti fenomeni"]
Questo non è il caso; la distribuzione era nota prima che fosse chiamata la distribuzione normale.
come dimostreresti a una persona del genere che la funzione di densità di probabilità di tutti i dati normalmente distribuiti ha una forma a campana
La normale funzione di distribuzione è quella che ha quella che di solito viene chiamata "forma a campana" - tutte le normali distribuzioni hanno la stessa "forma" (nel senso che differiscono solo per scala e posizione).
I dati possono apparire più o meno "a campana" nella distribuzione ma ciò non lo rende normale. Molte distribuzioni non normali sembrano similmente "a campana".
Le distribuzioni effettive della popolazione da cui i dati sono tratti non sono probabilmente mai realmente normali, sebbene a volte sia un'approssimazione abbastanza ragionevole.
Questo è in genere vero per quasi tutte le distribuzioni che applichiamo alle cose nel mondo reale: sono modelli , non fatti sul mondo. [Ad esempio, se facciamo alcune ipotesi (quelle per un processo di Poisson), possiamo derivare la distribuzione di Poisson - una distribuzione ampiamente usata. Ma questi presupposti sono mai esattamente soddisfatti? Generalmente il meglio che possiamo dire (nelle giuste situazioni) è che sono quasi veri.]
cosa consideriamo effettivamente i dati normalmente distribuiti? Dati che seguono il modello di probabilità di una distribuzione normale o qualcos'altro?
Sì, per essere effettivamente distribuito normalmente, la popolazione da cui è stato prelevato il campione dovrebbe avere una distribuzione che abbia la forma funzionale esatta di una distribuzione normale. Di conseguenza, qualsiasi popolazione finita non può essere normale. Le variabili che sono necessariamente delimitate non possono essere normali (ad esempio, i tempi presi per compiti particolari, le lunghezze di cose particolari non possono essere negative, quindi non possono essere effettivamente distribuiti normalmente).
sarebbe forse più intuitivo che la funzione di probabilità dei dati normalmente distribuiti abbia la forma di un triangolo isoscele
Non vedo perché questo sia necessariamente più intuitivo. È sicuramente più semplice.
Quando hanno sviluppato per la prima volta modelli per la distribuzione di errori (in particolare per l'astronomia all'inizio del periodo), i matematici hanno considerato una varietà di forme in relazione alle distribuzioni di errori (compresa in un primo momento una distribuzione triangolare), ma in gran parte di questo lavoro si è trattato di matematica (piuttosto di intuizione) che è stato utilizzato. Laplace ha esaminato le doppie distribuzioni esponenziali e normali (tra le altre), per esempio. Allo stesso modo Gauss usava la matematica per ricavarla all'incirca nello stesso momento, ma in relazione a una serie di considerazioni diversa da quella di Laplace.
Nel senso stretto che Laplace e Gauss stavano prendendo in considerazione "distribuzioni di errori", potremmo considerarli come una "ricerca di una distribuzione", almeno per un certo periodo. Entrambi hanno postulato alcune proprietà per una distribuzione di errori che hanno ritenuto importanti (Laplace ha considerato una sequenza di criteri alquanto diversi nel tempo) ha portato a distribuzioni diverse.
Fondamentalmente la mia domanda è: perché la normale funzione di densità di probabilità di distribuzione ha una forma a campana e non un'altra?
La forma funzionale della cosa che è chiamata la normale funzione di densità le dà quella forma. Considera lo standard normale (per semplicità; ogni altro normale ha la stessa forma, differendo solo per scala e posizione):
fZ( z) = k ⋅ e- 12z2;- ∞ < z< ∞
K
X
Mentre alcune persone hanno considerato la distribuzione normale come in qualche modo "normale", in realtà è solo in particolari insiemi di situazioni che si tende addirittura a vederla come un'approssimazione.
La scoperta della distribuzione è generalmente attribuita a de Moivre (come approssimazione al binomio). In effetti ha derivato la forma funzionale quando ha tentato di approssimare i coefficienti binomiali (/ probabilità binomiali) per approssimare calcoli altrimenti noiosi ma - mentre ricava efficacemente la forma della distribuzione normale - non sembra aver pensato alla sua approssimazione come a distribuzione della probabilità, sebbene alcuni autori suggeriscano che lo abbia fatto. È richiesta una certa quantità di interpretazione, quindi c'è spazio per le differenze nell'interpretazione.
Gauss e Laplace vi lavorarono all'inizio del 1800; Gauss ne scrisse nel 1809 (in relazione al fatto che era la distribuzione per cui la media è l'MLE del centro) e Laplace nel 1810, come approssimazione alla distribuzione di somme di variabili casuali simmetriche. Un decennio dopo Laplace fornisce una prima forma di teorema del limite centrale, per variabili discrete e continue.
I primi nomi per la distribuzione includono la legge dell'errore , la legge della frequenza degli errori , ed è stata anche chiamata Laplace e Gauss, a volte congiuntamente.
Il termine "normale" è stato usato per descrivere la distribuzione in modo indipendente da tre diversi autori nel 1870 (Peirce, Lexis e Galton), il primo nel 1873 e gli altri due nel 1877. Questo è più di sessant'anni dopo il lavoro di Gauss e Laplace e più del doppio rispetto all'approssimazione di de Moivre. L'uso di Galton fu probabilmente il più influente, ma usò il termine "normale" in relazione ad esso solo una volta in quell'opera del 1877 (per lo più chiamandola "la legge della deviazione").
Tuttavia, nel 1880 Galton usò l'aggettivo "normale" in relazione alla distribuzione numerose volte (ad esempio come la "curva normale" nel 1889), e a sua volta ebbe molta influenza sugli statistici successivi nel Regno Unito (specialmente Karl Pearson ). Non ha spiegato perché abbia usato il termine "normale" in questo modo, ma presumibilmente lo ha inteso nel senso di "tipico" o "normale".
Il primo uso esplicito della frase "distribuzione normale" sembra essere di Karl Pearson; lo usa certamente nel 1894, anche se afferma di averlo usato molto prima (un'affermazione che prenderei in considerazione con una certa cautela).
Riferimenti:
Miller, Jeff
"I primi usi noti di alcune delle parole della matematica:"
Distribuzione normale (Entrata di John Aldrich)
http://jeff560.tripod.com/n.html
Stahl, Saul (2006),
"L'evoluzione della distribuzione normale",
Mathematics Magazine , Vol. 79, n. 2 (aprile), pagg. 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
Distribuzione normale, (2016, 1 agosto).
In Wikipedia, l'enciclopedia libera.
Estratto 12:02, 3 agosto 2016, da
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History
Hald, A (2007),
"L'approssimazione normale di De Moivre al binomio, 1733, e la sua generalizzazione",
In: Una storia di inferenza statistica parametrica da Bernoulli a Fisher, 1713–1935; pp 17-24
[Si possono notare sostanziali discrepanze tra queste fonti in relazione al loro account di de Moivre]