Distribuzione campionaria da due popolazioni indipendenti di Bernoulli


17

Supponiamo di avere campioni di due variabili casuali indipendenti di Bernoulli, e .Ber(θ1)Ber(θ2)

Come dimostriamo che ?

(X¯1X¯2)(θ1θ2)θ1(1θ1)n1+θ2(1θ2)n2dN(0,1)

Supponiamo che .n1n2


Z_i = X_1i - X_2i è una sequenza di iid rv di media e varianza finite. Quindi soddisfa il teorema del limite centrale di Levy-Linderberg da cui derivano i risultati. O stai chiedendo una prova del clt stesso?
Tre diag,

@ThreeDiag Come stai applicando la versione LL del CLT? Non penso sia corretto. Scrivi una risposta per me per controllare i dettagli.
Un vecchio nel mare.

Tutti i dettagli sono già lì. Per applicare LL è necessaria una sequenza di iid rv con media e varianza finite. La variabile Z_i = X_i1 e X_i2 soddisfa tutti e tre i requisiti. L'indipendenza segue dall'indipendenza dei due bariulli originali e si può vedere che E (Z_i) e V (Z_i) sono limitati applicando le proprietà standard di E e V
Three Diag,

1
"campioni di due variabili casuali indipendenti di Bernoulli" - espressione errata. Deve essere: "due campioni indipendenti dalle distribuzioni di Bernoulli".
Viktor,

1
Aggiungi "as ". n1,n2
Viktor,

Risposte:


10

Metti ,b=a=θ1(1θ1)n1 , A=(ˉX1-θ1)/a, B=(ˉX2-θ2)/b. Abbiamo AdN(0,1),BdN(0,1). In termini di funzioni caratteristiche significa ϕA(t)Eeb=θ2(1θ2)n2A=(X¯1θ1)/aB=(X¯2θ2)/bAdN(0,1), BdN(0,1) Vogliamo dimostrare che D:= a

ϕA(t)EeitAet2/2, ϕB(t)et2/2.
D:=aa2+b2Aba2+b2BdN(0,1)

Poiché e B sono indipendenti, ϕ D ( t ) = ϕ A ( aAB come vogliamo che sia.

ϕD(t)=ϕA(aa2+b2t)ϕB(ba2+b2t)et2/2,

Questa prova è incompleta. Qui abbiamo bisogno di alcune stime per una convergenza uniforme delle funzioni caratteristiche. Tuttavia, nel caso in esame, possiamo fare calcoli espliciti. Inserisci . ϕ X 1 , 1 ( t )p=θ1, m=n1 comet3m-3/20. Pertanto, per unatfissa, ϕD(t)=(1-a2t2

ϕX1,1(t)=1+p(eit1),ϕX¯1(t)=(1+p(eit/m1))m,ϕX¯1θ1(t)=(1+p(eit/m1))meipt,ϕA(t)=(1+p(eit/mp(1p)1))meiptm/p(1p)=((1+p(eit/mp(1p)1))eipt/mp(1p))m=(1t22m+O(t3m3/2))m
t3m3/20t
ϕD(t)=(1a2t22(a2+b2)n1+O(n13/2))n1(1b2t22(a2+b2)n2+O(n23/2))n2et2/2
a0b0|ey(1y/m)m|y2/2m  when  y/m<1/2 (see /math/2566469/uniform-bounds-for-1-y-nn-exp-y/ ).

Note that similar calculations may be done for arbitrary (not necessarily Bernoulli) distributions with finite second moments, using the expansion of characteristic function in terms of the first two moments.


This seems correct. I'll get back to you later on, when I have time to check everything. ;)
An old man in the sea.

-1

Proving your statement is equivalent to proving the (Levy-Lindenberg) Central Limit Theorem which states

If {Zi}i=1n is a sequence of i.i.d random variable with finite mean E(Zi)=μ and finite variance V(Zi)=σ2 then

n(Z¯μ)dN(0,σ2)

Here Z¯=iZi/n that is the sample variance.

Then it is easy to see that if we put

Zi=X1iX2i
with X1i,X2i following a Ber(θ1) and Ber(θ2) respectively the conditions for the theorem are satisfied, in particular

E(Zi)=θ1θ2=μ

and

V(Zi)=θ1(1θ1)+θ2(1θ2)=σ2

(There's a last passage, and you have to adjust this a bit for the general case where n1n2 but I have to go now, will finish tomorrow or you can edit the question with the final passage as an exercise )


I could not obtain what I wanted exactly because of the possibility of n1n2
An old man in the sea.

I will show later if you can't get it. Hint: compute the variance of the sample mean of Z and use that as the variable in the theorem
Three Diag

Three, could you please add the details for when n1n2? Thanks
An old man in the sea.

Will do as soon as find a little timr. There was in fact a subtlety that prevents from using LL clt without adjustment. There are three ways to go, the simplest of which is invoking the fact that for large n1 and n2, X1 and X2 go in distribution to normals, then a linear combination of normal is also normal. This is a property of normals that you can take as given, otherwise you can prove it by characteristic functions.
Three Diag

The other two require either a different clt (Lyapunov possibly) or alternatively treat n1 = i and n2= i +k. Then for large i you can essentially disregard k and you can go back to apply LL (but still it will require some care to nail the right variance)
Three Diag
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.