Soluzione all'esercizio 2.2a.16 di "Statistiche affidabili: l'approccio basato sulle funzioni di influenza"


9

A pagina 180 di statistiche affidabili: l'approccio basato sulle funzioni di influenza si trova la seguente domanda:

  • 16: Mostra che per gli stimatori invarianti di posizione sempre . Trova il limite superiore corrispondente sul punto di campione finito , entrambi nel caso in cui è dispari o è pari.ε12εnnn

La seconda parte (dopo il periodo) è in realtà banale (data la prima) ma non riesco a trovare un modo per dimostrare la prima parte (frase) della domanda.

Nella sezione del libro relativa a questa domanda si trova (p98):

Definizione 2: Il punto di rottura del campione finito di uno stimatore sul campione è dato da:εnTn(xl,,xn)

εn(Tn;xi,,xn):=1nmax{m:maxi1,,imsupy1,,ym|Tn(z1,,zn)|<}

dove il campione (z1,,zn) viene ottenuto sostituendo m punti dati xi1,,xim con valori arbitrari y1,,ym.

La definizione formale di stessa funziona per quasi una pagina, ma può essere considerata come Anche se non definita esplicitamente, una può indovinare che invariante posizione significa che deve soddisfare ε = lim n ε n T n T n ( x 1 , , x n ) = T n ( x 1 + c , , x n + c ) ,  per tutto  c Rε

ε=limnεn
Tn
Tn(x1,,xn)=Tn(x1+c,,xn+c), for all cR

Io (provo a) rispondere alla domanda di Whuber nel commento qui sotto. Il libro definisce lo stimatore è di diverse pagine, a partire da p82, provo a riprodurre le parti principali (penso che risponderà alla domanda di Whuber):Tn

Supponiamo di avere osservazioni unidimensionali che sono indipendenti e identicamente distribuite (iid). Le osservazioni appartengono allo spazio campione , che è un sottoinsieme della linea reale (spesso equivale semplicemente a stesso, quindi le osservazioni possono assumere qualsiasi valore ). Un modello parametrico è costituito da una famiglia di distribuzioni di probabilità , nello spazio campione, in cui il parametro sconosciuto appartiene ad alcuni spazi dei parametriH R H R F θ θ Θ(X1,,Xn)HRHRFθθΘ

...

Identifichiamo il campione con la sua distribuzione empirica , ignorando la sequenza delle osservazioni (come quasi sempre viene fatto). Formalmente, , è data da dove , è la massa punto 1 in . Come stimatori di , consideriamo le statistiche con valori reali . In senso lato, uno stimatore può essere visto come una sequenza di statistiche , una per ogni possibile dimensione del campione . Idealmente, le osservazioni sono definite secondo un membro del modello parametrico G n G n ( 1 / n ) n i = 1 Δ x i Δ X X θ T n = T n ( X 1 , , X n ) = T n ( G n ) { T n , n 1 } n {(X1,,Xn)GnGn(1/n)i=1nΔxiΔXXθTn=Tn(X1,,Xn)=Tn(Gn){Tn,n1}nF ( H ) H{Fθ;θΘ} , ma la classe di tutte le possibili distribuzioni di probabilità su è molto più grande.F(H)H

Consideriamo stimatori che sono funzionali [cioè, per tutti e ] o che possono essere asintoticamente sostituiti da funzionali. Ciò significa che supponiamo che esista una funzionale [dove il dominio di è l'insieme di tutte le distribuzioni per cui è definito] tale che in probabilità quando le osservazioni sono indicate secondo la vera distribuzione in . Diciamo chen G n T : dominio ( T ) R T F ( H ) T T n ( X 1 , , X n ) n T ( G ) G dominio ( T ) T ( G ) { T nTn(Gn)=T(Gn)nGnT:domain(T)RTF(H)T

Tn(X1,,Xn)nT(G)
Gdomain(T)T(G)è il valore asintotico di a .G{Tn;n1}G

...

In questo capitolo, assumiamo sempre che i funzionali studiati siano coerenti con Fisher (Kallianpur e Rao, 1955): che significa che a il modello lo stimatore misura asintoticamente la giusta quantità. Il concetto di coerenza di Fisher è più adatto ed elegante per i funzionali rispetto alla consistenza consueta o all'imparzialità asintotica.{ T n ; n 1 }

T(Fθ)=θ for all θΘ
{Tn;n1}


1
In che modo questo libro definisce esattamente "stimatore"? Mi sembra che qualsiasi stimatore limitato debba avere un punto di rottura di , quindi sicuramente sta ponendo una sorta di restrizioni speciali su ; e esistono sempre stimatori invarianti di posizione limitati (includeranno le costanti). 1 T nTn1Tn
whuber

1
Grazie per il materiale espanso. Sembra ancora che ci siano molti controesempi. Un semplice è lo stimatore costante per la famiglia a un parametro delle normali distribuzioni della varianza . Questo è uno stimatore invariante posizione della varianza. Il suo punto di rottura è . Fisher è coerente (banalmente), ma ho bisogno di interpretare attentamente la definizione: " " non può riferirsi necessariamente a tutti i parametri, poiché nessuno stimatore invariante della posizione potrebbe essere coerente! 1 1 θTn(X1,,Xn)=111θ
whuber

@whuber: Grazie, capisco il tuo contro-esempio. Penso che contatterò l'autore e chiederò ulteriori informazioni ...
user603

Risposte:


4

I vecchi libri statistici usavano "invariante" in un modo leggermente diverso da quello che ci si potrebbe aspettare; l'ambigua terminologia persiste. Un equivalente più moderno è "equivariante" (vedere i riferimenti alla fine di questo post). Nel presente contesto significa

Tn(X1+c,X2+c,,Xn+c)=Tn(X1,X2,,Xn)+c

per tutto il vero .c

Per rispondere alla domanda, quindi, supponiamo che abbia la proprietà che per sufficientemente grande , tutto reale e tutto ,Tnncmεn

|Tn(X+Y)Tn(X)|=o(|c|)

ogni volta che differisce da da al massimo in al massimo coordinate.YXcm

(Questa è una condizione più debole di quella assunta nella definizione di limite di rottura. In realtà, tutto ciò che dobbiamo davvero supporre è che quando è sufficientemente grande, l'espressione " " è un valore garantito per essere inferiore a in dimensioni.)no(|c|)|c|/2

La prova è per contraddizione. Supponiamo, di conseguenza, che anche questo sia equivariante e supponiamo che . Quindi per , sufficientemente grandi è un numero intero per il quale sia e . Per qualsiasi numero reale definireTnε>1/2nm(n)=εnm(n)/nε(nm(n))/nεa,b

tn(a,b)=Tn(a,a,,a, b,b,,b)

dove ci sono 's e ' s. Modificando o meno delle coordinate concludiamo entrambem(n) anm(n) bm(n)

|t(a,b)t(0,b)|=o(|a|)

e

|t(a,b)t(a,0)|=o(|b|).

Per afferma la disuguaglianza del triangoloc>0

c=|tn(c,c)tn(0,0)||tn(c,c)tn(c,0)|+|tn(c,0)tn(0,0)|=o(c)+o(c)<c/2+c/2=c

La rigorosa disuguaglianza sulla penultima linea è assicurata per sufficientemente grande . La contraddizione che implica, , dimostranc<cε1/2.


Riferimenti

EL Lehmann, teoria della stima puntuale . John Wiley 1983.

Nel testo (capitolo 3, sezione 1) e una nota a piè di pagina che Lehmann scrive

Uno stimatore che soddisfa per tutti sarà chiamato equivariante ...δ(X1+a,,Xn+a)=δ(X1,,Xn)+aa

Alcuni autori chiamano tali stimatori "invarianti". Poiché ciò suggerisce che lo stimatore rimane invariato in , sembra preferibile riservare quel termine per funzioni che soddisfano per tutte le .u ( x + a ) = u ( x ) x , aXi=Xi+au(x+a)=u(x)x,a


1
sì, ieri ho contattato l'autore principale del libro con la stessa domanda sull'effettiva definizione di invarianza utilizzata (ho guardato nell'indice e non l'ho trovato esplicito nel libro). Ho votato perché penso che la tua risposta sia quella corretta, ma darò all'autore un paio di giorni per essere sicuro prima di accettarla.
user603

1
Non ho ricevuto una risposta dall'autore, ma gli argomenti presentati sopra (nella risposta e nel commento) mi hanno convinto che questa deve essere davvero la corretta interpretazione del problema.
user603
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.