Relazione tra Hessian Matrix e Covariance Matrix


12

Mentre sto studiando la stima della massima verosimiglianza, per dedurre la stima della massima verosimiglianza, dobbiamo conoscere la varianza. Per scoprire la varianza, ho bisogno di conoscere il Rao Lower Bound di Cramer, che assomiglia a una matrice hessiana con seconda derivazione sulla curvatura. Sono un po 'confuso per definire la relazione tra matrice di covarianza e matrice di iuta. Spero di sentire alcune spiegazioni sulla domanda. Un semplice esempio sarà apprezzato.

Risposte:


13

Dovresti prima dare un'occhiata a questa domanda di base sulla matrice delle informazioni di Fisher e sulla relazione con l'Assia e gli errori standard

Supponiamo di avere un modello statistico (famiglia di distribuzioni) . Nel caso più generale abbiamo , in modo da questa famiglia è parametrizzato da . In determinate condizioni di regolarità, abbiamod i m ( Θ ) = d θ = ( θ 1 , , θ d ) T{fθ:θΘ}diom(Θ)=dθ=(θ1,...,θd)T

ioio,j(θ)=-Eθ[2l(X;θ)θioθj]=-Eθ[Hio,j(l(X;θ))]

dove è una matrice di informazioni di Fisher (in funzione di ) e è il valore osservato (campione) θ Xioio,jθX

l(X;θ)=ln(fθ(X)), per alcuni θΘ

Quindi la matrice di informazioni di Fisher è un valore atteso negato di Hesian della probabilità logaritmica in alcuniθ

Supponiamo ora di stimare alcune funzioni vettoriali del parametro sconosciuto . Di solito si desidera che lo stimatore sia imparziale, cioèT ( X ) = ( T 1 ( X ) , , T d ( X ) )ψ(θ)T(X)=(T1(X),...,Td(X))

θΘ Eθ[T(X)]=ψ(θ)

Cramer Rao Lower Bound afferma che per ogni imparziale il soddisfac o v θ ( T ( X ) )T(X)covθ(T(X))

covθ(T(X))ψ(θ)θio-1(θ)(ψ(θ)θ)T=B(θ)

dove per matrici significa che è semi-definito positivo , è semplicemente un giacobino . Nota che se stimiamo , cioè , sopra semplificaA - B ψ ( θ )UNBUN-B Ji,j(ψ)θψ(θ)=θψ(θ)θJio,j(ψ)θψ(θ)=θ

covθ(T(X))io-1(θ)

Ma cosa ci dice davvero? Ad esempio, ricordalo

vun'rθ(Tio(X))=[covθ(T(X))]io,io

e che per ogni semi-definita positiva matrice diagonali siano non negativoUN

io UNio,io0

Dall'alto possiamo concludere che la varianza di ciascun elemento stimato è delimitata da elementi diagonali della matriceB(θ)

io vun'rθ(Tio(X))[B(θ)]io,io

Quindi CRLB non ci dice la varianza del nostro stimatore, ma se il nostro stimatore è ottimale o meno , cioè se ha la covarianza più bassa tra tutti gli stimatori imparziali.


2
Apprezzo la tua spiegazione qui. Non sono davvero una persona matematica, ma sto imparando la matematica in modo serio. Tuttavia, mi sembra ancora troppo astratto. Spero che ci sia un esempio gentile con numeri semplici, che lo capiranno sicuramente.
user122358,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.