Prendi in considerazione un vettore di parametri , con il parametro di interesse e un parametro di disturbo.θ 1 θ 2
Se è la probabilità costruita dai dati , la probabilità del profilo per è definita come dove è l'MLE di per un valore fisso di .x θ 1 L P ( θ 1 ; x ) = L ( θ 1 , θ 2 ( θ 1 ) ; x ) θ 2 ( θ 1 ) θ 2 θ 1
Massimizzare la probabilità del profilo rispetto a porta alla stessa stima di quella ottenuta massimizzando la probabilità contemporaneamente rispetto a e .θ 1 θ 1 θ 2
Penso che la deviazione standard di possa anche essere stimata dalla seconda derivata della verosimiglianza del profilo.
La statistica di probabilità per può essere scritta in termini di probabilità del profilo: .
Quindi, sembra che la probabilità del profilo possa essere utilizzata esattamente come se fosse una vera probabilità. È davvero il caso? Quali sono gli svantaggi principali di questo approccio? E che dire della "voce" che lo stimatore ottenuto dalla probabilità del profilo è distorto (modifica: anche asintoticamente)?