Famiglia esponenziale: statistiche sufficienti osservate vs. attese


10

La mia domanda sorge dalla lettura di "Stimare una distribuzione di Dirichlet" di Minka , che afferma quanto segue senza prove nel contesto della derivazione di uno stimatore della massima verosimiglianza per una distribuzione di Dirichlet basata su osservazioni di vettori casuali:

Come sempre con la famiglia esponenziale, quando il gradiente è zero, le statistiche sufficienti attese sono uguali alle statistiche sufficienti osservate.

Non ho visto la stima della massima verosimiglianza nella famiglia esponenziale presentata in questo modo, né ho trovato spiegazioni adeguate nella mia ricerca. Qualcuno può offrire informazioni sulla relazione tra statistiche sufficienti osservate e attese e forse aiutare a capire la stima della massima verosimiglianza come minimizzare la loro differenza?

Risposte:


11

Questa è una solita affermazione sulla famiglia esponenziale, ma a mio avviso, la maggior parte delle volte è dichiarata in un modo che può confondere il lettore meno esperto. Perché, preso al valore nominale, potrebbe essere interpretato come "se la nostra variabile casuale segue una distribuzione nella famiglia esponenziale, quindi se prendiamo un campione e lo inseriamo nella statistica sufficiente, otterremo il vero valore atteso della statistica ". Se solo fosse così ... Inoltre non tiene conto delle dimensioni del campione, il che può causare ulteriore confusione.

La funzione di densità esponenziale è

(1)fX(x)=h(x)eη(θ)T(x)eA(θ)

dove è la statistica sufficiente.T(x)

Poiché questa è una densità, deve integrarsi nell'unità, quindi ( è il supporto di X )SxX

(2)Sxh(x)eη(θ)T(x)eA(θ)dx=1

Eq. vale per tutti θ in modo da poter differenziare entrambe le parti rispetto ad esso:(2)θ

(3)θSxh(x)eη(θ)T(x)eA(θ)dx=(1)θ=0

Intercambiando l'ordine di differenziazione e integrazione, otteniamo

(4)Sxθ(h(x)eη(θ)T(x)eA(θ))dx=0

Effettuare la differenziazione che abbiamo

(5)θ(h(x)eη(θ)T(x)eA(θ))=fX(x)[T(x)η(θ)A(θ)]

(5)(4)

SxfX(x)[T(x)η(θ)A(θ)]dx=0

(6)η(θ)E[T(X)]A(θ)=0E[T(X)]=A(θ)η(θ)

(6)θθT(X)θ0(6)

(6a)Eθ0[T(X)]=A(θ)η(θ)|θ=θ0

n

L(θx)=i=1nlnh(xi)+η(θ)i=1nT(xi)nA(θ)

θ0

(7)θ^(x):1ni=1nT(xi)=A(θ)η(θ)|θ=θ^(x)

(7)(6a)2 θθ^3,4,5,6θ^6aθ^

(6b)Eθ^(x)[T(X)]=A(θ)η(θ)|θ=θ^(x)

(7)

Eθ^(x)[T(X)]=1ni=1nT(xi)

θ^(x)θx

n=1


Potresti approfondire ulteriormente il motivo per cui la transizione da 6a a 6b è valida, per favore?
Teoden,

1
(2)(3)(2) θθ^3,4,5,6θ^

@AlecosPapadopoulos la tua prova di seguito sembra suggerire che cosa dici all'inizio - "se la nostra variabile casuale segue una distribuzione nella famiglia esponenziale, quindi se prendiamo un campione e lo inseriamo nella statistica sufficiente, otterremo il vero valore atteso della statistica "è vero. Voglio dire, posso sempre farlo per (2), sostituendolo con stat sufficiente osservato e ottenere il risultato. Cosa mi sto perdendo qui? Non capisco bene.
user10024395

6aθ6b

1
Potresti spiegare perché possiamo scambiare l'ordine di differenziazione e integrazione in eq. (3) per favore?
Markus777,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.