Assia della probabilità del profilo utilizzata per la stima dell'errore standard


13

Questa domanda è motivata da questa . Ho cercato due fonti e questo è quello che ho trovato.

A. van der Vaart, Statistiche assintotiche:

Raramente è possibile calcolare esplicitamente la probabilità di un profilo, ma la sua valutazione numerica è spesso fattibile. Quindi la probabilità del profilo può servire a ridurre la dimensione della funzione di probabilità. Le funzioni di verosimiglianza del profilo sono spesso utilizzate allo stesso modo delle funzioni di verosimiglianza (ordinarie) dei modelli parametrici. Oltre a prendere i punti di massima come stimatori θ , la derivata seconda a θ viene usato come stima è meno l'inverso della matrice di covarianza asintotica di e. Ricerche recenti sembrano confermare questa pratica.θ^θ^

J. Wooldridge, Analisi econometrica dei dati di sezioni trasversali e panel (lo stesso in entrambe le edizioni):

Come dispositivo per lo studio delle proprietà asintotiche, la funzione obiettivo concentrata ha un valore limitato perché generalmente dipende da tutto W , nel qual caso la funzione obiettivo non può essere scritta come la somma di somme indipendenti e distribuite in modo identico. Un'impostazione in cui l'equazione (12.89) è una somma di funzioni iid si verifica quando concentriamo gli effetti specifici individuali da determinati modelli di dati del pannello non lineari. Inoltre, la funzione obiettivo concentrata può essere utile per stabilire l'equivalenza di approcci di stima apparentemente diversi.g(W,β)W

Wooldridge discute il problema in un contesto più ampio di stimatori M, quindi si applica anche agli stimatori della massima verosimiglianza.

Quindi otteniamo due risposte diverse per la stessa domanda. Il diavolo secondo me è nei dettagli. Per alcuni modelli possiamo usare la tela di iuta con probabilità di profilo in modo sicuro per alcuni modelli no. Ci sono risultati generali che danno condizioni quando possiamo farlo (o non)?


Questi passaggi non sembrano affatto rispondere alla stessa domanda: il primo riguarda il calcolo numerico per un determinato set di dati mentre il secondo riguarda "lo studio delle proprietà asintotiche". L'uso dell'Assia è in genere una considerazione puramente matematica con risposte in genere semplici: vedi la nostra discussione correlata .
whuber

van der Vaart afferma che l'Assia viene utilizzata per il calcolo della matrice di covarianza asintotica . Poiché Wooldridge afferma che la funzione oggettiva concentrata non può essere utilizzata per lo studio delle proprietà asintotiche, ciò implica che la sua hessiana (numerica) non può essere utilizzata per stimare errori standard. Non ho dimenticato la nostra discussione, quindi prendo questo passaggio con il chicco di sale. Tuttavia, né van der Vaart né Wooldridge hanno fornito riferimenti. Prima di fare le ricerche approfondite, volevo solo verificare che forse questo è qualcosa di ben noto.
mpiktas,

Punto eccellente: in qualche modo ho trascurato l '"asintotico" nella citazione di van der Vaart. Tuttavia, potrebbe non esserci ancora alcuna contraddizione: Wooldridge afferma semplicemente che l'ovvia semplice giustificazione (iid summues) non è disponibile per dimostrare che l'approccio di van der Vaart funziona; Wooldridge non dice che non funziona ;-).
whuber

@whuber, sì, ma non dice nemmeno che funzioni :) Sono consapevole che potrebbe non esserci contraddizione, voglio solo sapere se ci sono alcuni risultati definiti.
mpiktas,

2
Vedi sul profilo Likelihood (SA Murphy e AW van der Vaart), jstor.org/pss/2669386
whuber

Risposte:


1

Per alcuni modelli possiamo usare la tela di iuta con probabilità di profilo in modo sicuro per alcuni modelli no

Sfortunatamente, questo è vero per ora e sgradevole cambiare.

La discussione più chiara di cui sono a conoscenza è Le regole dell'inferenza condizionale: esiste una definizione universale di non formazione? B Jørgensen - Statistical Methods & Applications, 1994.

E per alcune delle questioni specifiche relative alla risoluzione dei fallimenti della verosimiglianza del profilo Stafford, JE (1996). Una solida regolazione della probabilità del profilo, Annals of Statistics, 24, 336-52.


1

Una risposta veloce: questo è discusso nel capitolo tre di OE Barndorff-Nielsen e DR Cox: inferenza e asintotici, Chapman & Hall, pagina 90, equazione 3.31, che attribuiscono a Patefield. Concludono che per un parametro scalare questo è valido (non analizzano altri casi).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.