Come derivare la funzione di probabilità per la distribuzione binomiale per la stima dei parametri?


22

Secondo la probabilità e le statistiche di Miller e Freund per gli ingegneri, 8ed (pp.217-218), la funzione di probabilità da massimizzare per la distribuzione binomiale (prove di Bernoulli) è data come

L(p)=Πio=1npXio(1-p)1-Xio

Come arrivare a questa equazione? Mi sembra abbastanza chiaro per quanto riguarda le altre distribuzioni, Poisson e Gaussian;

L(θ)=Πio=1nPDF o PMF di dist.

Ma quello per il binomio è solo un po 'diverso. Per essere diretto, come ha fatto

nCX pX(1-p)n-X

diventare

pXio(1-p)1-Xio

nella funzione di verosimiglianza sopra?

Risposte:


25

Nella stima della massima verosimiglianza, stai cercando di massimizzare nCX pX(1-p)n-X ; tuttavia, massimizzare questo equivale a massimizzare pX(1-p)n-X per una fissa X.

In realtà, anche la probabilità per il gaussiano e il poisson non coinvolge le loro costanti principali, quindi questo caso è proprio come quelli come w


Affrontare i commenti OP

Ecco un po 'più di dettaglio:

Innanzitutto, è il numero totale di successi mentre x i è una singola prova (0 o 1). Perciò:Xxi

i=1npxi(1p)1xi=p1nxi(1p)1n1xi=px(1p)nx

Ciò mostra come ottenere i fattori nella probabilità (eseguendo i passaggi precedenti all'indietro).

Perché la costante scompare? Informalmente, e ciò che la maggior parte delle persone fa (incluso me), è solo notare che la costante principale non influenza il valore di che massimizza la probabilità, quindi la ignoriamo (impostandola effettivamente su 1).p

Possiamo ricavarlo prendendo il registro della funzione di verosimiglianza e trovando dove la sua derivata è zero:

ln(nCx px(1p)nx)=ln(nCx)+xln(p)+(nx)ln(1p)

Prendi la derivata wrt e imposta su 0 :p0

ddpln(nCX)+Xln(p)+(n-X)ln(1-p)=Xp-n-X1-p=0

nX=1pp=Xn

Si noti che la costante principale è stata esclusa dal calcolo dell'MLE.

L1,L2L1=KL2p

A livello pratico, l'inferenza che utilizza la funzione di verosimiglianza si basa in realtà sul rapporto di verosimiglianza, non sul valore assoluto della verosimiglianza. Ciò è dovuto alla teoria asintotica dei rapporti di probabilità (che sono asintoticamente chi-quadrati - soggetti a determinate condizioni di regolarità che sono spesso appropriate). I test del rapporto di verosimiglianza sono favoriti a causa del Lemma di Neyman-Pearson . Pertanto, quando proviamo a testare due semplici ipotesi, prenderemo il rapporto e il fattore principale comune verrà annullato.

NOTA: questo non accadrà se si confrontassero due modelli diversi, diciamo un binomio e un poisson. In tal caso, le costanti sono importanti.

Tra i motivi di cui sopra, il primo (irrilevanza nel trovare il massimizzatore di L) risponde più direttamente alla tua domanda.


2
nCXn

@ ÉbeIsaac ha aggiunto alcuni dettagli

2

xi nel prodotto si riferisce a ogni singola prova. Per ogni singola prova xi può essere 0 o 1 e n è sempre uguale a 1. Pertanto, banalmente, il coefficiente binomiale sarà uguale a 1. Quindi, nella formula del prodotto per probabilità, il prodotto dei coefficienti binomiali sarà 1 e quindi non c'è nCx nella formula. Realizzato questo mentre lo risolvo passo dopo passo :) (Mi dispiace per la formattazione, non abituato a rispondere con espressioni matematiche nelle risposte ... ancora :))

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.