Consenti a essere un percorso della catena markov e che sia la probabilità di osservare il percorso quando è il vero valore del parametro (ovvero la funzione di probabilità per ). Usando la definizione di probabilità condizionale, lo sappiamo{Xi}Ti=1Pθ(X1,...,XT)θθ
Pθ(X1,...,XT)=Pθ(XT|XT−1,...,X1)⋅Pθ(X1,...,XT−1)
Poiché si tratta di una catena markov, sappiamo che , quindi questo semplifica questoPθ(XT|XT−1,...,X1)=Pθ(XT|XT−1)
Pθ(X1,...,XT)=Pθ(XT|XT−1)⋅Pθ(X1,...,XT−1)
Ora, se ripeti questa stessa logica volte, ottieniT
Pθ(X1,...,XT)=∏i=1TPθ(Xi|Xi−1)
dove deve essere interpretato come lo stato iniziale del processo. I termini sul lato destro sono solo elementi della matrice di transizione. Poiché era la probabilità di log che hai richiesto, la risposta finale è:X0
L(θ)=∑i=1Tlog(Pθ(Xi|Xi−1))
Questa è la probabilità di una singola catena markov - se il tuo set di dati include diverse catene (indipendenti) markov, la probabilità completa sarà una somma dei termini di questo modulo.