Quali sono gli svantaggi della probabilità del profilo?


19

Prendi in considerazione un vettore di parametri , con il parametro di interesse e un parametro di disturbo.θ 1 θ 2(θ1,θ2)θ1θ2

Se è la probabilità costruita dai dati , la probabilità del profilo per è definita come dove è l'MLE di per un valore fisso di .x θ 1 L P ( θ 1 ; x ) = L ( θ 1 , θ 2 ( θ 1 ) ; x ) θ 2 ( θ 1 ) θ 2 θ 1L(θ1,θ2;x)xθ1LP(θ1;x)=L(θ1,θ^2(θ1);x)θ^2(θ1)θ2θ1

Massimizzare la probabilità del profilo rispetto a porta alla stessa stima di quella ottenuta massimizzando la probabilità contemporaneamente rispetto a e .θ 1 θ 1 θ 2θ1θ^1θ1θ2

Penso che la deviazione standard di possa anche essere stimata dalla seconda derivata della verosimiglianza del profilo.θ^1

La statistica di probabilità per può essere scritta in termini di probabilità del profilo: .H0:θ1=θ0LR=2log(LP(θ^1;x)LP(θ0;x))

Quindi, sembra che la probabilità del profilo possa essere utilizzata esattamente come se fosse una vera probabilità. È davvero il caso? Quali sono gli svantaggi principali di questo approccio? E che dire della "voce" che lo stimatore ottenuto dalla probabilità del profilo è distorto (modifica: anche asintoticamente)?


2
solo una nota, gli stimatori della probabilità possono anche essere distorti, l'esempio classico è la stima della varianza della probabilità per il campione normale.
mpiktas,

@mpiktas: grazie per il tuo commento. In effetti, il mle classico può anche essere di parte. Modificherò la domanda per chiarire le cose.
Ocram,

qual è il pregiudizio assintotico? Stai parlando di stimatori non coerenti?
mpiktas,

@mpiktas: Sì, questo è quello che avrei dovuto dire ...
Ocram,

Risposte:


14

La stima di dalla probabilità del profilo è solo l'MLE. Massimizzare rispetto a θ 2 per ogni possibile θ 1 e quindi massimizzare rispetto a θ 1 equivale a massimizzare rispetto a ( θ 1 , θ 2 ) congiuntamente.θ1θ2θ1θ1(θ1,θ2)

La debolezza chiave è che, se si basa la stima della SE di θ 1 sulla curvatura del profilo probabilità, non sono completamente la contabilità per l'incertezza nella θ 2 .θ^1θ2

McCullagh e Nelder, modelli lineari generalizzati, 2a edizione , hanno una breve sezione sulla probabilità del profilo (Sec 7.2.4, pagg. 254-255). Dicono:

[A] set di confidenza pproximate possono essere ottenuti nel solito modo .... tali intervalli di confidenza sono spesso soddisfacenti se [la dimensione di ] è piccola rispetto alle informazioni totali di Fisher, ma possono essere fuorvianti altrimenti. .. Purtroppo [la verosimiglianza del log del profilo] non è una funzione di verosimiglianza nel solito senso. Più ovviamente, la sua derivata non ha media zero, una proprietà essenziale per la stima delle equazioni.θ2


ElP(θ1)θ10

Domanda interessante, anche se ha richiesto un viaggio nello scaffale (cosa che avrei dovuto fare comunque). Ho aggiunto un po 'alla mia risposta su questo punto.
Karl,

Grazie mille per la modifica. Si dice che la proprietà (il punteggio valutato al valore del parametro vero abbia zero medio) è essenziale per stimare le equazioni. Ma sebbene la probabilità del log del profilo non soddisfi tale proprietà, produce l'MLE. C'è qualcosa che mi manca?
Ocram,

Tale proprietà non è necessaria per fornire l'MLE.
Karl,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.