Errore nell'approssimazione normale di una distribuzione di somma uniforme


20

Un metodo ingenuo per approssimare una distribuzione normale è quello di sommare forse variabili IID casuali distribuite uniformemente su , quindi più recenti e ridimensionare, basandosi sul Teorema del limite centrale. ( Nota a margine : esistono metodi più accurati come la trasformazione di Box – Muller .) La somma delle variabili casuali IID è nota come distribuzione di somma uniforme o distribuzione di Irwin-Hall .[ 0 , 1 ]100[0,1]U(0,1)

Quanto è grande l'errore nell'approssimazione di una distribuzione di somma uniforme con una distribuzione normale?

Ogni volta che questo tipo di domanda sorge per l'approssimazione della somma delle variabili casuali IID, le persone (incluso me) sollevano il teorema di Berry-Esseen , che è una versione efficace del teorema del limite centrale dato che esiste il terzo momento:

|Fn(x)Φ(x)|Cρσ3n

dove è la funzione di distribuzione cumulativa per la somma riscalata di variabili casuali IID, è il terzo momento centrale assoluto, è la deviazione standard e è una costante assoluta che può essere considerata o anche . n ρ E | ( X - E X ) 3 | σ C 1 1 / 2FnnρE|(X-EX)3|σC11/2

Questo non è soddisfacente. Mi sembra che la stima di Berry-Esseen sia la più vicina a sharp sulle distribuzioni binomiali che sono discrete, con l'errore più grande a per una distribuzione binomiale simmetrica. L'errore più grande arriva al salto più grande. Tuttavia, la distribuzione della somma uniforme non ha salti.0

Test numerici suggeriscono che l'errore si riduce più rapidamente di .c/n

Usando , la stima di Berry – Esseen èC=1/2

|Fn(X)-Φ(X)|121321123n0.650n

che per è rispettivamente di circa , e . Le differenze massime effettive per sembrano essere rispettivamente di circa , e , che sono molto più piccole e sembrano cadere come anziché .0,205 0,145 0,103 n = 10 , 20 , 40 0,00281 0,00139 0,000692 c / n c / n=10,20,400,2050,1450.103n=10,20,400,00,281 mila0,00,139 mila0.000692c/nc/n


7
Se espandi la distribuzione della somma in un'espansione Edgeworth , scopri che uniformemente in come (poiché la distribuzione uniforme è simmetrica), quindi suona a destra. A causa del termine , ciò non ti dà un limite però ...x n c / n o ( n - 1 )Fn(X)=Φ(X)+n-1g(X)+o(n-1)Xnc/no(n-1)
MånsT

1
Grazie, sembra che spieghi lo schema per molte altre distribuzioni. c/n
Douglas Zare,

Risposte:


17

Consenti a essere iid variabili casuali e considera la somma normalizzata e la norma associata dove è la distribuzione di .U ( - b , b ) S n = U1,U2,...U(-B,B)sup δ n = sup x R | F n ( x ) - Φ ( x ) |

Sn=3Σio=1nUioBn,
cenare
δn=cenareXR|Fn(X)-Φ(X)|,
S nFnSn

Lemma 1 ( Uspensky ): vale il seguente limite su . δ n < 1δn

δn<17.5πn+1π(2π)n+12π3nexp(-π2n/24).

Prova . Vedi JV Uspensky (1937), Introduzione alla probabilità matematica , New York: McGraw-Hill, p. 305.

Questo è stato successivamente migliorato da R. Sherman a quanto segue.

Lemma 2 ( Sherman ): vale il seguente miglioramento sul limite di Uspensky.

δn<17.5πn-(π180+17.5πn)e-π2n/24+1(n+1)π(2π)n+12π3ne-π2n/24.

Prova : vedi R. Sherman, Errore dell'approssimazione normale alla somma di N variabili casuali , Biometrika , vol. 58, n. 2, 396–398.

La dimostrazione è un'applicazione piuttosto semplice della disuguaglianza del triangolo e dei limiti classici sulla coda della distribuzione normale e su applicato alle funzioni caratteristiche di ciascuna delle due distribuzioni.(peccatoX)/X


2
+1 È in Lemma 2? N=n

@Procrastinator: buona cattura.
cardinale il

1
Grazie! Quei riferimenti sono molto utili. Le stime sembrano rientrare in un fattore del valore effettivo. 2
Douglas Zare,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.