Date due catene assorbenti di Markov, qual è la probabilità che una si interrompa prima dell'altra?


9

Ho due diverse catene di Markov, ognuna con uno stato assorbente e una posizione iniziale nota. Voglio determinare la probabilità che la catena 1 raggiunga uno stato di assorbimento in meno passaggi rispetto alla catena 2.

Penso di poter calcolare la probabilità di raggiungere uno stato assorbente in una particolare catena dopo n passaggi: data una matrice di transizione P la probabilità di essere assorbito dopo n passaggi è Piojn dove io è lo stato iniziale e j è lo stato assorbente .

Non sono sicuro di dove andare da qui però. Problemi analoghi che ho visto coinvolgono dadi (ad esempio, tirare una somma di 7 prima di una somma di 8), ma è più facile da risolvere perché la probabilità di ottenere una somma particolare è costante e indipendente dal numero di passi compiuti finora.

Risposte:


13

Esegui le catene in parallelo. Definire tre stati di assorbimento nella catena di prodotti risultante:

  1. La prima catena raggiunge uno stato di assorbimento, ma la seconda no.

  2. La seconda catena raggiunge uno stato di assorbimento, ma la prima no.

  3. Entrambe le catene raggiungono contemporaneamente uno stato assorbente.

Le probabilità limitanti di questi tre stati nella catena del prodotto danno le possibilità di interesse.


Questa soluzione prevede alcune (semplici) costruzioni. Come in questione, lasciate una matrice di transizione per una catena P . Quando la catena è nello stato i , P i j dà la probabilità di una transizione allo stato j . Uno stato assorbente fa una transizione verso se stesso con probabilità 1 .P=Pioj,1io,jnPioPiojj1

  1. Qualsiasi stato può essere assorbito dopo aver sostituito la riga P i = ( P i j , j = 1 , 2 , ... , n ) con un vettore indicatore ( 0 , 0 , ... , 0 , 1 , 0 , ... , 0 ) con 1 in posizione i .ioPio=(Pioj,j=1,2,...,n)(0,0,...,0,1,0,...,0)1io
  2. Qualsiasi insieme di stati assorbenti può essere unito creando una nuova catena P / A i cui stati sono { iUNP/UN . La matrice di transizione è data da{io|ioUN}{UN}

    (P/UN)ioj={PiojioUN,jUNΣKUNPioKioUN,j=UN0io=UN,jUN1io=j=UN.

    Ciò equivale a sommare le colonne di corrispondenti ad A e sostituire le righe corrispondono ad A con una singola riga che fa una transizione verso se stessa.PUNUN

  3. Il prodotto di due catene sugli stati S P e Q sugli stati S Q , con matrici di transizione P e Q , rispettivamente, è una catena di Markov sugli stati S P × S Q = { ( p , q )PSPQSQPQ con matrice di transizioneSP×SQ={(p,q)|pSP,qSQ}

    (PQ)(io,j),(K,l)=PioKQjl.

    In effetti, la catena di prodotti gestisce le due catene in parallelo, localizzando separatamente dove ciascuna è e effettuando le transizioni in modo indipendente.


Un semplice esempio può chiarire queste costruzioni. Supponiamo che Polly stia lanciando una moneta con una probabilità di teste di atterraggio. Ha in programma di farlo fino ad osservare una testa. Gli stati per il processo di lancio della moneta sono S P = { T , H } che rappresentano i risultati del lancio più recente: T per le code, H per le teste. Progettando di fermarsi alla testa, Polly applicherà la prima costruzione rendendo H uno stato assorbente. La matrice di transizione risultante èpSP={T,H}THH

P=(1-pp01).

Inizia in uno stato casuale dato dal primo lancio.(1-p,p)

A tempo con Polly, Quincy lancerà una moneta giusta. Ha intenzione di fermarsi quando vede due teste di fila. La sua catena Markov deve quindi tenere traccia sia del risultato precedente che di quello attuale. Esistono quattro combinazioni del genere di due teste e due code, che abbrevierò come " ", ad esempio, in cui la prima lettera è il risultato precedente e la seconda lettera è il risultato corrente . Quincy applica la costruzione (1) per rendere HH uno stato assorbente. Dopo averlo fatto, si rende conto che non ha davvero bisogno di quattro stati: può semplificare la sua catena in tre stati: T significa che il risultato corrente è croce, H significa che il risultato corrente è testa e XTHHHTHXsignifica che gli ultimi due risultati sono stati entrambi i capi - questo è lo stato assorbente. La matrice di transizione è

Q=(1212012012001).

La catena di prodotti funziona su sei stati: . La matrice di transizione è un prodotto tensore di P e Q ed è altrettanto facilmente calcolabile. Ad esempio, ( PQ ) ( T ,(T,T),(T,H),(T,X);(H,T),(H,H),(H,X)PQ è la probabilità che Polly effettua una transizione daTaTe, allo stesso tempo (e indipendente), Quincy effettua una transizione daTaH. Il primo ha una probabilità di1-pe la possibilità di quest'ultimo1 / 2. Poiché le catene sono gestite in modo indipendente, queste possibilità si moltiplicano, dando(1-p) / 2. La matrice di transizione completa è(PQ)(T,T),(T,H)TTTH1-p1/2(1-p)/2

PQ=(1-p21-p20p2p201-p201-p2p20p2001-p00p0001212000012012000001).

È in forma di matrice a blocchi con blocchi corrispondenti alla seconda matrice :Q

PQ=(P11QP12QP21QP22Q)=((1-p)QpQ0Q).

Polly e Quincy competono per vedere chi raggiungerà per primo il loro obiettivo. Il vincitore sarà Polly ogni volta che viene effettuata una transizione a dove * non è X ; il vincitore sarà Quincy ogni volta che viene effettuata una transizione a ( T , X ) ; e se prima che uno di questi può accadere viene effettuata una transizione a ( H , X ) , il risultato sarà un pareggio. Per tenere traccia, faremo gli stati ( H , T ) e ( H , H )(H,*)*X(T,X)(H,X)(H,T)(H,H)entrambi assorbono (tramite costruzione (1)) e poi li uniscono (tramite costruzione (2)). La matrice di transizione risultante, ordinata dagli stati è(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X)

R=(1-p21-p20p01-p201-p2p2p2001000001000001).

(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X)μ=((1-p)/2,(1-p)/2,0,p,0)

n

μRn11+4p-p2(0,0,(1-p)2,p(5-p),p(1-p)).

(T,X),{(H,T),(H,H)},(H,X)(1-p)2:p(5-p):p(1-p)

figura

p


1
Esempio molto pulito, grazie per questo. Sto ancora elaborando i dettagli per vederli di persona. Solo una domanda: qui abbiamo ipotizzato che i due eventi (i tiri di Polly e Quincy) si stessero verificando simultaneamente, che differenza farebbe se li rendessimo sequenziali, o addirittura scegliamo a caso ogni volta chi lancerebbe il prossimo?
user929304

1
@ user929304 Si otterrebbero risposte diverse, possibilmente sostanzialmente. Ad esempio, supponiamo che P e Q stiano eseguendo una catena in cui gli stati sono suddivisi in sottoinsiemi A e B in cui tutte le transizioni da A vanno a B e tutte da B vanno ad A. Sia P che Q inizino entrambi agli stati in A. In la catena di prodotti si alternano simultaneamente tra A e B, ma le catene sequenziali e a scelta casuale interrompono quel modello invariante.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.