Stimatori efficienti imparziali sono stocasticamente dominanti su altri stimatori (mediani) imparziali?


9

Descrizione generale

Uno stimatore efficiente (che ha una varianza del campione uguale al limite di Cramér-Rao) massimizza la probabilità di essere vicino al vero parametro ?θ

Supponiamo di confrontare la differenza o la differenza assoluta tra la stima e il vero parametro

Δ^=θ^θ

La distribuzione di per uno stimatore efficiente domina stocasticamente la distribuzione di per qualsiasi altro stimatore imparziale?Δ^Δ~


Motivazione

Sto pensando a questo a causa della domanda Stimatore che è ottimale sotto tutte le funzioni di perdita sensibile (valutazione) in cui possiamo dire che il miglior stimatore imparziale rispetto a una funzione di perdita convessa è anche il miglior stimatore imparziale rispetto ad un'altra funzione di perdita (Da Iosif Pinelis, 2015, Una caratterizzazione dei migliori stimatori imparziali.ArXiv prestampa arXiv: 1508.07636 ). Il dominio stocastico per essere vicino al vero parametro sembra essere simile a me (è una condizione sufficiente e un'affermazione più forte).


Espressioni più precise

L'affermazione della domanda sopra è ampia, ad es. Quale tipo di imparzialità è considerata e abbiamo la stessa metrica di distanza per differenze negative e positive?

Consideriamo i seguenti due casi per rendere la domanda meno ampia:

Congettura 1: Se è una media efficiente e uno stimatore medio-imparziale. Quindi per qualsiasi stimatore medio-imparziale-imparziale dove eθ^θ~

if x>0 then P[Δ^x]P[Δ~x]if x<0 then P[Δ^x]P[Δ~x]
Δ^=θ^θΔ~=θ~θ

Congettura 2: Se è uno stimatore medio-imparziale efficiente. Quindi per qualsiasi stimatore medio-imparziale eθ^θ~x>0

P[|Δ^|x]P[|Δ~|x]

  • Le congetture di cui sopra sono vere?
  • Se le proposizioni sono troppo forti, possiamo adattarle per farlo funzionare?

Il secondo è correlato al primo ma abbassa la restrizione per l'imparzialità mediana (e quindi dobbiamo mettere insieme entrambe le parti o altrimenti la proposizione sarebbe falsa per qualsiasi stimatore che ha una mediana diversa rispetto allo stimatore efficiente).


Esempio, illustrazione:

Prendere in considerazione la stima della media della distribuzione di una popolazione (che si presume che sia normale distribuito) da (1) la mediana del campione e (2) la media campionaria.μ

Nel caso di un campione di dimensione 5, e quando la vera distribuzione della popolazione è questo sembraN(0,1)

esempio cdf

Nell'immagine vediamo che il CDF piegato della media del campione (che è uno stimatore efficiente per ) è al di sotto del CDF piegato della mediana del campione. La domanda è se il CDF piegato della media del campione sia inferiore al CDF piegato di qualsiasi altro stimatore imparziale.μ

In alternativa, usando il CDF anziché i CDF piegati possiamo porre la domanda se il CDF di una media massimizzi la distanza da 0,5 in ogni punto. Sappiamo che

θ^:|Fmean(θ^)0.5||Fmedian(θ^)0.5|

abbiamo anche questo quando sostituiamo per la distribuzione di qualsiasi altro stimatore medio e imparziale mediano?Fmedian(θ^)


2
Controlla la Pitman nearnessparola chiave, non che trovo questo criterio particolarmente sensato.
Xi'an,

1
Dalla congettura, sembrerebbe più ragionevole usare stimatori non mediani rispetto agli stimatori medio-imparziali. (Stimatori non distorti esistono in poche impostazioni e meglio imparziali in ancora meno impostazioni.)
Xi'an

1
Il "criterio di vicinanza di Pitman" è davvero interessante. Sulla base delle informazioni su Wikipedia lo vedo come "la probabilità che la differenza assoluta sia più vicina". È un po 'diverso però. Questo criterio di vicinanza di Pitman potrebbe creare casi interessanti in cui alcuni stimatori presentano in media una differenza assoluta minore ma non vincono in base a questo criterio di vicinanza.
Sesto Empirico

1
Il criterio che proponi è invariante per le trasformazioni monotono biiettive, ma l'imparzialità media non lo è, mentre l'imparzialità mediana lo è. È anche incredibilmente forte in quanto il cdf di deve essere al di sopra del cdf di sopra e sotto il cdf di sotto , per tutti i valori del parametro . θ^θ~θθ~θθ
Xi'an,

1
@ Xi'an Ho aggiunto un esempio visivo e ora ricevo il tuo commento sulla polarizzazione mediana rispetto alla polarizzazione media. Ho adattato la domanda (sebbene diverga dalla mia idea originale relativa alla domanda collegata che ora necessita di alcuni aggiustamenti più complessi).
Sesto Empirico

Risposte:


5

Ecco un esperimento in un caso non standard, il problema della posizione di Cauchy, dove non standard significa che non esiste uno stimatore imparziale uniformemente migliore. Consideriamo un campione da una distribuzione di Cauchy e i seguenti quattro stimatori invarianti di :(X1,,XN)C(μ,1)μ

  1. μ^1=median(X1,,XN)=X(N/2)
  2. μ^2=mean(X(N/4),,X(3N/4))=2N(X(N/4)++X(3N/4))
  3. μ^3=μMLE che è efficiente
  4. μ^4=μ^1+2Nμ(μ^1)

Quindi il confronto dei cdf dei quattro stimatori porta a questa immagine, in cui i cdf di (oro) e (pomodoro) sono comparabili e migliorano su (steelblue), stesso migliorando su (sienna). μ^3μ^4μ^1μ^2inserisci qui la descrizione dell'immagine

Una rappresentazione delle differenze rispetto al cdf empirico del MLE rende più chiaro:

inserisci qui la descrizione dell'immagine

Ecco il codice R corrispondente:

T=1e4
N=11
mlechy=function(x){
  return(optimize(function(theta) -sum(dcauchy(x, 
    location=theta, log=TRUE)),  c(-100,100))$minimum)
}
est=matrix(0,T,4)
for (t in 1:T){
cauc=sort(rcauchy(N))
est[t,1]=median(cauc)
est[t,2]=mean(cauc[4:8])
est[t,3]=mlechy(cauc)
est[t,4]=est[t,1]+(4/N)*sum((cauc-est[t,1])/(1+(cauc-est[t,1])^2))
}

plot(ecdf(est[,1]),col="steelblue",cex=.4,xlim=c(-1,1),main="",ylab="F(x)")
plot(ecdf(est[,2]),add=TRUE,col="sienna",cex=.4)
plot(ecdf(est[,3]),add=TRUE,col="gold",cex=.4)
plot(ecdf(est[,4]),add=TRUE,col="tomato",cex=.4)

1
La curva dell'oro (la differenza della MLE empirica con se stessa non dovrebbe essere zero nel diagramma delle differenze).
Sesto Empirico

Mio male, ho cambiato i codici colore: il pomodoro è per la differenza con il quarto, l'oro per la differenza con Pitman, il sienna per la differenza con la media tagliata e il blu per la differenza con la mediana.
Xi'an,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.