Perché la correzione della continuità (diciamo l'approssimazione normale alla distribuzione binomiale) funziona?


24

Vorrei capire meglio come è stata derivata la correzione di continuità alla distribuzione binomiale per l'approssimazione normale.

Quale metodo è stato usato per decidere che dovremmo aggiungere 1/2 (perché non un altro numero?). Qualsiasi spiegazione (o un collegamento alla lettura suggerita, diversa da questa , sarebbe apprezzata).

Risposte:


29
  1. In realtà non sempre "funziona" (nel senso di migliorare sempre l'approssimazione del binomio cdf del normale in qualsiasi ). Se il binomio è 0,5 penso che aiuti sempre, tranne forse per la coda più estrema. Se non è troppo lontano da 0,5, per ragionevolmente grande generalmente funziona molto bene tranne nella coda lontana, ma se è vicino a 0 o 1 potrebbe non essere affatto d'aiuto (vedere il punto 6. sotto)xpppnp

  2. Una cosa da tenere a mente (nonostante le illustrazioni che coinvolgono quasi sempre pmfs e pdf) è che la cosa che stiamo cercando di approssimare è il cdf. Può essere utile ponderare cosa sta succedendo con il cdf del binomio e la normale approssimativa (ad esempio qui ):n=20,p=0.5

    inserisci qui la descrizione dell'immagine

    Nel limite il cdf di un binomio standardizzato passerà a una normale standard (si noti che la standardizzazione influisce sulla scala sull'asse x ma non sull'asse y); lungo la strada per sempre grandi salti del CDF binomio tendono a cavalcare in modo più uniforme il CDF normale.n

    Ingrandiamo e guardiamo questo nel semplice esempio sopra:

    inserisci qui la descrizione dell'immagine

    Si noti che poiché la normale approssimativa passa vicino al centro dei salti verticali *, mentre nel limite il normale cdf è localmente approssimativamente lineare e (come lo è la progressione del binomio cdf nella parte superiore di ogni salto); di conseguenza il cdf tende a incrociare i gradini orizzontali vicino a . Se vuoi approssimare il valore del binomio cdf, all'intero , il normale cdf raggiunge quell'altezza vicino a . F(x)xx+1x+12F(x)xx+12

    * Se applichiamo Berry-Esseen alle variabili di Bernoulli con correzione media, i limiti di Berry-Esseen consentono pochissimo spazio di oscillazione quando è vicino a e è vicino a - il normale cdf deve passare ragionevolmente vicino al centro di i salti lì perché altrimenti la differenza assoluta nei cdf supererà il miglior Berry-Essen legato da una parte o dall'altra. Questo a sua volta si riferisce a quanto lontano da il normale cdf può attraversare parte orizzontale della funzione di passaggio del binomio cdf.1p xμx+112xμx+12

  3. Espandendo la motivazione che in 1. consideriamo come useremmo una normale approssimazione al binomio cdf per elaborare . Ad esempio (vedere il secondo diagramma sopra). Quindi il nostro normale con la stessa media e sd è . Si noti che vorremmo approssimare il salto in cdf a 9 con la modifica del cdf normale tra circa 8,5 e 9,5.n = 20 , p = 0,5 , k = 9 N ( 10 , ( P(X=k)n=20,p=0.5,k=9N(10,(5)2)

inserisci qui la descrizione dell'immagine

  1. Facendo la stessa cosa con la motivazione meno formale ma più "normale" del libro di testo (che è forse più intuitiva, specialmente per gli studenti principianti), stiamo provando ad approssimare una variabile discreta con una continua. Possiamo fare una versione continua del binomio sostituendo ogni picco di probabilità di altezza con un rettangolo di larghezza 1 centrato su , dandogli altezza (vedi il rettangolo blu sotto; immagina uno per ogni x- valore) e quindi approssimando quello per la densità normale con la stessa media e sd del binomio originale:x p ( x )p(x)xp(x)

    ! [inserisci la descrizione dell'immagine qui

    L'area sotto la casella è approssimata dalla normale tra e ; le due parti quasi triangolari che si trovano sopra e sotto il gradino orizzontale sono vicine tra loro nell'area. Una certa somma delle probabilità binomiali in un intervallo si riduce a una raccolta di queste approssimazioni. (Disegnare un diagramma come questo è spesso molto utile se non è immediatamente chiaro se è necessario salire o scendere di 0,5 per un determinato calcolo ... determinare quali valori binomiali si desidera nel calcolo e andare su entrambi i lati di per ognuno.)x12x+1212

    Si può motivare questo approccio algebricamente usando una derivazione [lungo le linee di De Moivre - vedi qui o qui per esempio] per derivare la normale approssimazione (sebbene possa essere eseguita in qualche modo più direttamente dell'approccio di De Moivre).

    Ciò procede essenzialmente attraverso diverse approssimazioni, incluso l'uso dell'approssimazione di Stirling sul termine e usando quel per ottenere quello(nx)log(1+x)xx2/2

    P(X=x)12πnp(1p)exp((xnp)22np(1p))

    vale a dire che la densità di una normale con media e varianza in è approssimativamente l'altezza del binomio pmf in . Questo è essenzialmente dove De Moivre è arrivato.μ=npσ2=np(1p)xx

    Quindi ora consideriamo che abbiamo un'approssimazione della regola del punto medio per le aree normali in termini di altezze binomiali ... cioè, per , la regola del punto medio dice che e abbiamo da De Moivre che . Sfogliandolo, .YN(np,np(1p))F(y+12)F(y12)=y12y+12fY(u)dufY(y)fY(x)P(X=x)P(X=x)F(x+12)F(x12)

    [Un'approssimazione di tipo "regola del punto medio" simile può essere usata per motivare altre simili approssimazioni di pmfs continui per densità usando una correzione di continuità, ma bisogna sempre fare attenzione a dove ha senso invocare quell'approssimazione]

  2. Nota storica: la correzione della continuità sembra aver avuto origine con Augustus de Morgan nel 1838 come un miglioramento dell'approssimazione di De Moivre. Vedi, ad esempio, Hald (2007) [1]. Dalla descrizione di Hald, il suo ragionamento era lungo le linee del punto 4. sopra (cioè essenzialmente in termini di tentativo di approssimare il pmf sostituendo il picco di probabilità con un "blocco" di larghezza 1 centrato sul valore x).

  3. Un'illustrazione di una situazione in cui la correzione della continuità non aiuta:

    inserisci qui la descrizione dell'immagine

    Nel grafico a sinistra (dove come prima, è il binomio, è l'approssimazione normale), e quindi . Nel grafico a destra (lo stesso binomio ma più avanti nella coda), e quindi - che è dire che ignorare la correzione della continuità è meglio che usarla in questa regione.XYp(x)FY(x+1FX(x)FY(x+12)FX(x)FY(x)p(x)FY(x)-FY(x-1)p(x)FY(x+12)FY(x12)FX(x)FY(x)p(x)FY(x)FY(x1)

    [1]: Hald, Anders (2007),
    "Una storia di inferenza statistica parametrica da Bernoulli a Fisher, 1713-1935",
    Fonti e studi nella storia della matematica e delle scienze fisiche,
    Springer-Verlag New York


1

Credo che il fattore derivi dal fatto che stiamo confrontando una distribuzione continua con una discreta. Dobbiamo quindi tradurre il significato di ciascun valore discreto nella distribuzione continua. Potremmo scegliere un altro valore, tuttavia questo sarebbe sbilanciato su un dato intero. (cioè peseresti la probabilità di essere a 6 in più verso 7 di 5.)

Ho trovato un link utile qui: link

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.