Statistiche sufficienti congiuntamente complete: uniforme (a, b)


13

Sia X=(x1,x2,xn) un campione casuale dalla distribuzione uniforme su (a,b) , dove a<b . Sia Y1 e Yn le statistiche degli ordini più grandi e più piccole. Mostra che la statistica (Y1,Yn) è una statistica sufficiente congiuntamente completa per il parametro θ=(a,b).

Non è un problema per me dimostrare sufficiente utilizzando la fattorizzazione.

Domanda: come posso mostrare completezza? Preferibilmente vorrei un suggerimento.

Tentativo: posso mostrare E[g(T(x))]=0 implica g(T(x))=0 per la distribuzione uniforme di un parametro, ma mi sto bloccando sulla distribuzione uniforme di due parametri.

Ho provato a giocare con E[g(Y1,Yn)] e usando la distribuzione congiunta di Y1 e Yn , ma non sono sicuro che stia andando nella direzione corretta, poiché il calcolo mi sta facendo scattare.


1
Aggiungi il [self-study]tag e leggi la sua wiki . Si noti che è possibile utilizzare la formattazione in lattice per la matematica mettendo dollari in giro, ad esempio $x$produce . Ho cercato di comporre alcuni dei tuoi calcoli ma mi sento libero di cambiare o ripristinare se non sei soddisfatto del risultato. Potresti preferire la notazione per x anziché per x . x$\vec x$x$\mathbf x$x
Silverfish,

Risposte:


7

Prendiamo cura del calcolo di routine per te, così puoi arrivare al nocciolo del problema e divertirti a formulare una soluzione. Si tratta di costruire rettangoli come unioni e differenze di triangoli.

In primo luogo, scegliere i valori di e b che rendono i dettagli come semplice possibile. ab Mi piace : la densità univariata di qualsiasi componente di X = ( X 1 , X 2 , , X n ) è solo la funzione indicatore dell'intervallo [ 0 , 1 ] .a=0,b=1X=(X1,X2,,Xn)[0,1]

Troviamo la funzione di distribuzione di ( Y 1 , Y n ) . F(Y1,Yn)Per definizione, per ogni numero reale questo èy1yn

(1)F(y1,yn)=Pr(Y1y1 and Ynyn).

I valori di sono ovviamente o nel caso in cui uno qualsiasi di o sia al di fuori dell'intervallo , quindi supponiamo che siano entrambi in questo intervallo. (Supponiamo anche per evitare di discutere di banalità.) In questo caso l'evento può essere descritto in termini delle variabili originali come "almeno uno dei è minore o uguale a e nessuno degli supera . " Equivalentemente, tutti gli trovano in0 1 y 1 y n [ a , b ] = [ 0 , 1 ] n 2 ( 1 ) X = ( X 1 , X 2 , , X n ) X i y 1 X i y n X i [ 0 , y n ] ( y 1 , y n ]F01y1yn[a,b]=[0,1]n2(1)X=(X1,X2,,Xn)Xiy1XiynXi[0,yn]ma non è il caso in cui si trovano tutti . (y1,yn]

Poiché gli sono indipendenti, le loro probabilità si moltiplicano e danno e , rispettivamente, per questi due eventi appena menzionati. Così, ( y n - 0 ) n = y n n ( y n - y 1 ) nXi(yn0)n=ynn(yny1)n

F(y1,yn)=ynn(yny1)n.

La densità è la derivata parziale mista di ,FfF

f(y1,yn)=2Fy1yn(y1,yn)=n(n1)(yny1)n2.

Il caso generale per scala le variabili in base al fattore e sposta la posizione di . b - a a(a,b)baa Pertanto, per ,a<y1yn<b

F(y1,yn;a,b)=((ynaba)n(ynabay1aba)n)=(yna)n(yny1)n(ba)n.

Differenziando come prima otteniamo

f(y1,yn;a,b)=n(n1)(ba)n(yny1)n2.

Considera la definizione di completezza. Sia qualsiasi funzione misurabile di due variabili reali. Per definizione,g

(2)E[g(Y1,Yn)]=y1babg(y1,yn)f(y1,yn)dy1dyny1babg(y1,yn)(yny1)n2dy1dyn.

Dobbiamo dimostrare che quando questa aspettativa è zero per tutti , allora è certo che per qualsiasi .g = 0 ( a , b )(a,b)g=0(a,b)

Ecco il tuo suggerimento. Let essere qualsiasi funzione misurabile. Vorrei esprimerlo nella forma suggerita da come . Per farlo, ovviamente dobbiamo dividere per . Sfortunatamente, per questo non è definito ogni volta che . La chiave è che questo set ha misura zero, quindi possiamo trascurarlo. ( 2 ) h ( x , y ) = g ( x , y ) ( y - x ) n - 2 h ( y - x ) n - 2 n > 2 y - xh:R2R(2)h(x,y)=g(x,y)(yx)n2h(yx)n2n>2yx

Di conseguenza, dato qualsiasi misurabile , definireh

g(x,y)={h(x,y)/(yx)n2xy0x=y

Quindi diventa(2)

(3)y1babh(y1,yn)dy1dynE[g(Y1,Yn)].

(Quando l'attività mostra che qualcosa è zero, possiamo ignorare costanti di proporzionalità diverse da zero. Qui, ho lasciato cadere dal lato sinistro.)n(n1)/(ba)n2

Questo è un integrale su un triangolo rettangolo con ipotenusa che si estende da a e il vertice in . Indichiamo tale triangolo .(a,a)(b,b)(a,b)Δ(a,b)

Ergo , quello che devi mostrare è che se l'integrale di una funzione misurabile arbitraria su tutti i triangoli è zero, allora per ogni , (quasi sicuramente ) per tutti .hΔ(a,b)a<bh(x,y)=0(x,y)Δ(a,b)

Anche se potrebbe sembrare che non siamo considerazione qualsiasi rettangolo interamente contenuto nel mezzo piano . Può essere espresso in termini di triangoli:[u1,u2]×[v1,v2]y>x

[u1,u2]×[v1,v2]=Δ(u1,v2)(Δ(u1,v1)Δ(u2,v2))Δ(u2,v1).

Figura che mostra i tre triangoli sovrapposti per produrre il rettangolo

In questa figura, il rettangolo è ciò che resta del grande triangolo quando rimuoviamo i triangoli rossi e verdi sovrapposti (che contano due volte la loro intersezione marrone) e quindi sostituiamo la loro intersezione.

Di conseguenza, puoi immediatamente dedurre che l'integrale di su tutti questi rettangoli è zero. h Resta solo da mostrare che deve essere zero (a parte i suoi valori su un set di misura zero) ogni volta che . La prova di questa affermazione (intuitivamente chiara) dipende dall'approccio che si desidera adottare per la definizione di integrazione.y > xh(x,y)y>x


Ho provato a impostare l'equazione 3 uguale a zero, prendere la derivata su entrambi i lati e scambiare i segni (un'azione riflessa immagino) ma i risultati sembrano abbastanza spaventosi [1]. Esiste un approccio più ragionevole? [1] en.wikipedia.org/wiki/Leibniz_integral_rule#Higher_dimensions
mugen,

1
Considera le raccolte finite di triangoli sempre più piccoli che giacciono tutti lungo l'ipotenusa nella foto e prendi il limite poiché il diametro del triangolo più grande nella raccolta va a zero.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.