Cosa si intende per errore standard di una stima della massima verosimiglianza?


21

Sono un matematico che studia da solo le statistiche e in particolare con la lingua.

Nel libro che sto usando, c'è il seguente problema:

Una variabile casuale X è data come Pareto(α,60) -distribuito con α>0 . (Naturalmente, potresti prendere qualsiasi distribuzione a seconda di un parametro per il bene di questa domanda.) Quindi viene fornito un campione di cinque valori 14 , 21 , 6 , 32 , 2 .

Prima parte: "Utilizzando il metodo della massima verosimiglianza, trovare una stima α di α in base [del campione]." Questo non è stato un problema. La risposta è alfa4,6931 .α^αα^4.6931

Ma poi: "Dai un l'errore standard di α ."α^

Cosa si intende con questo? Dal momento che α è solo un numero reale fisso, non vedo in che modo potrebbe avere un errore standard. Sto per determinare la deviazione standard di Pareto ( α , 60 ) ?α^Pareto(α^,60)

Se ritieni che la domanda non sia chiara, anche questa informazione mi aiuterebbe.


Cosa significa ? 60
Alecos Papadopoulos,

Avete una formula per α ? Ciò ti aiuterà a stimare il suo errore standard. α^
Soakley,

1
@Glen_b Ma se fosse il limite inferiore come potrebbe essere che tutti i valori del campione realizzato siano più piccoli?
Alecos Papadopoulos,

1
@Alecos Questo è un punto eccellente. Il mio commento non ha senso; L'ho cancellato.
Glen_b

1
@Alecos: è la distribuzione con densità f ( x ) = α λ αPareto(α,λ) . f(X)=αλα(λ+X)α+1
Stefan

Risposte:


17

L'altra risposta ha riguardato la derivazione dell'errore standard, voglio solo aiutarti con la notazione:

La tua confusione è dovuta al fatto che in Statistica utilizziamo esattamente lo stesso simbolo per indicare lo stimatore (che è una funzione) e una stima specifica (che è il valore che lo stimatore assume quando riceve come input uno specifico campione realizzato).

Quindi α = h ( X ) e α ( X = x ) = 4,6931α^=h(X)α^(X=X)=4,6931 per . Quindi αX={14,21,6,32,2} è una funzione di variabili casuali e quindi una variabile casuale per sé, che di certo ha una varianza. α^(X)

Nella stima ML, in molti casi ciò che possiamo calcolare è l' errore standard asintotico , perché la distribuzione del campione finito dello stimatore non è nota (non può essere derivata).

A rigor di α^ non ha una distribuzione asintotica, dal momento che converge ad un numero reale (il vero numero in quasi tutti i casi di stima ML). Ma la quantità converge ad una variabile casuale normale (applicando il limite centrale teorema).n(α^-α)

Un secondo punto di confusione notazione : la maggior parte, se non tutti i testi, scriverà ( "Avar" = varianza asintotica ") mentre ciò che significano è Avar ( Avar(α^), cioè si riferiscono alla varianza asintotica della quantitàAvar(n(α^-α)), non di α ... Per il caso di una distribuzione di Pareto base abbiamon(α^-α)α^

Avar[n(α^-α)]=α2

e così

Avar(α^)=α2/n

(ma quello che troverete scritto è ) Avar(α^)=α2

Ora, in che senso la stima di α ha una "varianza asintotica", dal momento che come detto, asintoticamente converge ad una costante? Bene, in senso approssimativo e per campioni grandi ma finiti . Vale a dire da qualche parte tra un "piccolo" campione, in cui lo stimatore è una variabile casuale con distribuzione (solitamente) sconosciuta, e un campione "infinito", in cui lo stimatore è una costante, c'è questo "territorio campione ampio ma finito" dove lo stimatore non è ancora diventato una costante e dove la sua distribuzione e varianza sono derivate in modo circolare, usando prima il Teorema del limite centrale per derivare la distribuzione propriamente asintotica della quantità Z = α^(che è normale a causa del CLT), e poi girando le cose intorno e scrivere α =Z=n(α^α)(tenendo uno indietro passo e trattamentoncome finito) che mostraalfacome funzione affine del normale variabile casualeZα^=1nZ+αnα^Z , e così normalmente si distribuiti (sempre circa).


+1 per distinguere tra α eα^- certamente la notazione può essere incoerente. n(α^α)
Nate Pope,

21

- un rischio stimatore di massima - è una funzione di un campione casuale, e così è anche casuale (non fisso). Una stima dell'errore standard di α potrebbe essere ottenuto dalle informazioni Fisher,α^α^

I(θ)=E[2L(θ|Y=y)θ2|θ]

Dove è un parametro e L ( θ | Y = y ) è la funzione di verosimiglianza di θ condizionata dal campione casuale y . Intuitivamente, le informazioni di Fisher indicano la ripidezza della curvatura della superficie di verosimiglianza attorno alla MLE, e quindi la quantità di "informazioni" che y fornisce circa θθL(θ|Y=y)θyyθ .

Per una distribuzione con una singola realizzazione Y = y , la probabilità logaritmica in cui y 0 è noto:Pareto(α,y0)Y=yy0

Collegandosi alla definizione di informazioni di Fisher, I(α)=1

L(α|y,y0)=logα+αlogy0(α+1)logyL(α|y,y0)=1α+logy0logyL(α|y,y0)=1α2
Per un campione{y1,y2,. . . ,Yn}La massima verosimiglianza α è asintoticamente distribuito come: α n ~ N (α, 1
I(α)=1α2
{y1,y2,...,yn}α^
α^nN(α,1nI(α))=N(α,α2n), 
Where n is the sample size. Because α is unknown, we can plug in α^ to obtain an estimate the standard error:
SE(α^)α^2/n4.69312/52.1

1
For your second to last line, α^~nN(α,1nio(α)), non sembra che la notazione sia corretta. Sen, poi nnon può apparire sul lato destro. Invece, vuoiα^˙N(α,1nio(α))
user321627,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.