Sinossi
Hai riscoperto parte della costruzione descritta nel Teorema del limite centrale per mediane campione, che illustra un'analisi della mediana di un campione. (L'analisi ovviamente si applica, mutatis mutandis , a qualsiasi quantile, non solo alla mediana). Pertanto non sorprende che per grandi parametri Beta (corrispondenti a grandi campioni) si verifichi una distribuzione normale sotto la trasformazione descritta nella domanda. Ciò che interessa è la vicinanza alla Normale anche per piccoli parametri Beta. Questo merita una spiegazione.
Di seguito traccerò un'analisi. Per mantenere questo post a una lunghezza ragionevole, comporta un sacco di suggestivi sventoli di mano: il mio obiettivo è solo quello di sottolineare le idee chiave. Consentitemi quindi di riassumere i risultati qui:
Quando è vicino a β , tutto è simmetrico. Ciò fa sì che la distribuzione trasformata appaia già normale.αβ
Le funzioni della forma sembrano abbastanza normali in primo luogo, anche per piccoli valori di α e β (purché entrambi superino 1 e il loro rapporto non sia troppo vicino a 0 o 1 ).Φα−1(x)(1−Φ(x))β−1αβ101
L'apparente normalità della distribuzione trasformata è dovuta al fatto che la sua densità è costituita da una densità normale moltiplicata per una funzione in (2).
All'aumentare di e β , la deviazione dalla Normalità può essere misurata nei termini rimanenti in una serie di Taylor per la densità del tronco. Il termine dell'ordine n diminuisce in proporzione ai poteri ( n - 2 ) / 2 di α e β . Ciò implica che alla fine, per α e β sufficientemente grandi , tutti i termini di potenza n = 3 o maggiore sono diventati relativamente piccoli, lasciando solo un quadratico: che è precisamente la densità del log di una distribuzione normale.αβn(n−2)/2αβαβn=3
Collettivamente, questi comportamenti spiegano bene perché anche per i piccoli e β i quantili non estremi di un campione iid normale sembrano approssimativamente normali.αβ
Analisi
Poiché può essere utile generalizzare, sia una qualsiasi funzione di distribuzione, anche se abbiamo in mente F = Φ .FF=Φ
La funzione di densità di una variabile Beta ( α , β ) è, per definizione, proporzionale ag(y)(α,β)
yα−1(1−y)β−1dy.
Consentendo a essere la trasformata integrale di probabilità di x e la scrittura di f per la derivata di F , è immediato che x abbia una densità proporzionale ay=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
Poiché questa è una trasformazione monotonica di una distribuzione fortemente unimodale (una Beta), a meno che non sia piuttosto strano, anche la distribuzione trasformata sarà unimodale. Per studiare quanto potrebbe essere vicino alla Normale, esaminiamo il logaritmo della sua densità,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
dove è una costante irrilevante di normalizzazione.C
Espandere i componenti del nella serie Taylor per ordinarne tre attorno a un valore x 0 (che sarà vicino a una modalità). Ad esempio, possiamo scrivere l'espansione del registro F comelogG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
per qualche con | h | ≤ | x - x 0 | . Utilizzare una notazione simile per log ( 1 - F ) e log f . h|h|≤|x−x0|log(1−F)logf
Termini lineari
Il termine lineare in diventa così(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
Quando è una modalità di G (x0 , questa espressione è zero. Si noti che poiché i coefficienti sono funzioni continue di x 0 , poiché α e β sono variati, anche la modalità x 0 varierà continuamente. Inoltre, una volta che α e β sono sufficientemente grandi, iltermine c f 1 diventa relativamente insignificante. Se miriamo a studiare il limite come α → ∞ e β → ∞ per il quale α : β rimane in proporzione costante γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ, potremmo quindi scegliere una volta per tutte un punto base per il qualex0
γcF1+c1−F1=0.
Un buon caso è dove , dove α = β per tutto, e F è simmetrico su 0 . In questo caso è evidente x 0 = F ( 0 ) = 1 / 2 .γ=1α=βF0x0=F(0)=1/2
Abbiamo raggiunto un metodo per cui (a) nel limite, il termine del primo ordine nella serie Taylor svanisce e (b) nel caso speciale appena descritto, il termine del primo ordine è sempre zero.
Termini quadratici
Questa è la somma
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
Rispetto ad una distribuzione normale, il cui termine quadratico è , si può stimare che - 1 / ( 2 g 2 ( α , β ) ) è approssimativamente la varianza di G . Cerchiamo di standardizzare G riscalando x per la sua radice quadrata. non abbiamo davvero bisogno dei dettagli; è sufficiente capire che questo riscalaggio moltiplicherà il coefficiente di ( x−(1/2)(x−x0)2/σ2−1/(2g2(α,β))GGx nell'espansione di Taylor di ( - 1 / ( 2 g 2 ( α , β ) ) ) n / 2 .(x−x0)n(−1/(2g2(α,β)))n/2.
Termine residuo
Ecco la battuta finale: il termine dell'ordine nell'espansione di Taylor è, secondo la nostra notazione,n
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
After standardization, it becomes
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Both of the gi are affine combination of α and β. By raising the denominator to the n/2 power, the net behavior is of order −(n−2)/2 in each of α and β. As these parameters grow large, then, each term in the Taylor expansion after the second decreases to zero asymptotically. In particular, the third-order remainder term becomes arbitrarily small.
The case when F is normal
Ff(x)GFα−1(1−F)β−1
αβα=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ−1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.