Facendo la stessa cosa con la motivazione meno formale ma più "normale" del libro di testo (che è forse più intuitiva, specialmente per gli studenti principianti), stiamo provando ad approssimare una variabile discreta con una continua. Possiamo fare una versione continua del binomio sostituendo ogni picco di probabilità di altezza con un rettangolo di larghezza 1 centrato su , dandogli altezza (vedi il rettangolo blu sotto; immagina uno per ogni x- valore) e quindi approssimando quello per la densità normale con la stessa media e sd del binomio originale:x p ( x )p(x)xp(x)
L'area sotto la casella è approssimata dalla normale tra e ; le due parti quasi triangolari che si trovano sopra e sotto il gradino orizzontale sono vicine tra loro nell'area. Una certa somma delle probabilità binomiali in un intervallo si riduce a una raccolta di queste approssimazioni. (Disegnare un diagramma come questo è spesso molto utile se non è immediatamente chiaro se è necessario salire o scendere di 0,5 per un determinato calcolo ... determinare quali valori binomiali si desidera nel calcolo e andare su entrambi i lati di per ognuno.)x−12x+1212
Si può motivare questo approccio algebricamente usando una derivazione [lungo le linee di De Moivre - vedi qui o qui per esempio] per derivare la normale approssimazione (sebbene possa essere eseguita in qualche modo più direttamente dell'approccio di De Moivre).
Ciò procede essenzialmente attraverso diverse approssimazioni, incluso l'uso dell'approssimazione di Stirling sul termine e usando quel per ottenere quello(nx)log(1+x)≈x−x2/2
P(X=x)≈12πnp(1−p)−−−−−−−−−−√exp(−(x−np)22np(1−p))
vale a dire che la densità di una normale con media e varianza in è approssimativamente l'altezza del binomio pmf in . Questo è essenzialmente dove De Moivre è arrivato.μ=npσ2=np(1−p)xx
Quindi ora consideriamo che abbiamo un'approssimazione della regola del punto medio per le aree normali in termini di altezze binomiali ... cioè, per , la regola del punto medio dice che e abbiamo da De Moivre che . Sfogliandolo, .Y∼N(np,np(1−p))F(y+12)−F(y−12)=∫y+12y−12fY(u)du≈fY(y)fY(x)≈P(X=x)P(X=x)≈F(x+12)−F(x−12)
[Un'approssimazione di tipo "regola del punto medio" simile può essere usata per motivare altre simili approssimazioni di pmfs continui per densità usando una correzione di continuità, ma bisogna sempre fare attenzione a dove ha senso invocare quell'approssimazione]
Un'illustrazione di una situazione in cui la correzione della continuità non aiuta:
Nel grafico a sinistra (dove come prima, è il binomio, è l'approssimazione normale), e quindi . Nel grafico a destra (lo stesso binomio ma più avanti nella coda), e quindi - che è dire che ignorare la correzione della continuità è meglio che usarla in questa regione.XYp(x)≈FY(x+1FX(x)≈FY(x+12)FX(x)≈FY(x)p(x)≈FY(x)-FY(x-1)p(x)≈FY(x+12)−FY(x−12)FX(x)≈FY(x)p(x)≈FY(x)−FY(x−1)
[1]: Hald, Anders (2007),
"Una storia di inferenza statistica parametrica da Bernoulli a Fisher, 1713-1935",
Fonti e studi nella storia della matematica e delle scienze fisiche,
Springer-Verlag New York