Qual è il nome di questa distribuzione discreta (equazione di differenza ricorsiva) che ho derivato?


11

Mi sono imbattuto in questa distribuzione in un gioco per computer e volevo saperne di più sul suo comportamento. Viene dalla decisione se un determinato evento dovrebbe verificarsi dopo un determinato numero di azioni del giocatore. I dettagli oltre a ciò non sono rilevanti. Sembra applicabile ad altre situazioni e l'ho trovato interessante perché è facile da calcolare e crea una coda lunga.

Ad ogni passaggio n , il gioco genera un numero casuale uniforme 0X<1 . Se X<p(n) , l'evento viene attivato. Dopo che l'evento si è verificato una volta, il gioco reimposta n=0 e scorre nuovamente la sequenza. Sono interessato a una sola occorrenza dell'evento per questo problema, perché rappresenta la distribuzione utilizzata dal gioco. (Inoltre, è possibile rispondere a qualsiasi domanda relativa a più ricorrenze con un singolo modello di occorrenza).

La principale "anomalia" qui è che il parametro di probabilità in questa distribuzione aumenta nel tempo, o in altri termini, la soglia aumenta nel tempo. Nell'esempio cambia in modo lineare ma suppongo che potrebbero essere applicate altre regole. Dopo n passaggi o azioni dell'utente,

p(n)=kn

0<k<1nmaxp(nmax)1

Sono stato in grado di determinarlo

F ( n ) = p ( n ) + F ( n - 1 ) [ 1 - p ( n ) ] f ( n ) F ( n ) n p ( n )

f(n)=p(n)[1F(n1)]
e per PMF e CDF . In breve, la probabilità che la volontà evento sul ° passo è uguale alla probabilità , meno la probabilità che è già successo in qualsiasi fase precedente.
F(n)=p(n)+F(n1)[1p(n)]
f(n)F(n)np(n)

Ecco una trama del nostro amico Monte Carlo, per divertimento, con . La mediana raggiunge 21 e una media di 22. k0.003inserisci qui la descrizione dell'immagine

Questo è sostanzialmente equivalente a un'equazione di differenza del primo ordine dall'elaborazione del segnale digitale, che è il mio background, e quindi ho scoperto che è abbastanza nuovo. Sono anche incuriosito dall'idea che possa variare in base a qualsiasi formula arbitraria.p(n)

Le mie domande:

  1. Qual è il nome di questa distribuzione, se ne ha una?
  2. Esiste un modo per derivare un'espressione per senza riferimento a ?F ( n )f(n)F(n)
  3. Esistono altri esempi di distribuzioni ricorsive discrete come questa?

Edita processo chiarificato sulla generazione di numeri casuali.


1
Qual è il motivo per cui hai scelto le parentesi quadre anziché ()?
Cam.Davidson.Pilon

1
@ Cam.Davidson.Pilon: il mio sfondo DSP si è intrufolato. Tendiamo a usare parentesi quadre per funzioni temporali discrete. Immagino che questo debba essere stonante, quindi lo cambierò.
jbarlow,

1
Il processo che stai assumendo non appare chiaramente definito qui. Dici "Ad ogni passaggio , il gioco lancia un numero casuale Se , l'evento viene attivato." Ma non dai alcuna specifica su come viene disegnataPenso che sarebbe utile se il processo potesse essere descritto in modo un po 'più preciso. X X < p ( n ) XnXX<p(n)X
cardinale il

2
@jbarlow: scusami se la mia precedente osservazione non era chiara. Se per qualche , allora non c'è modo in cui il tuo processo possa avere più di passi poiché un numero casuale uniforme tra zero e uno sarebbe sicuramente più piccolo di per qualsiasi . La quantità in funzione di è strettamente correlata a quella che viene chiamata la funzione di rischio nel sottocampo delle statistiche note come analisi di sopravvivenza . 0 < k < 1 k - 1p ( n ) n > 1 / k p ( n ) np(n)=kn0<k<1k1p(n)n>1/kp(n)n
cardinale il

1
Per piccolo , l'uso dell'analogo differenziale di questa equazione di differenza mostra che ( non !) È vicino a Gaussiano. (Da ciò deduciamo immediatamente, ad esempio, che la media deve essere vicina a ). Tieni inoltre presente che esistono alcune (forti) restrizioni su , altrimenti, una volta che supera (cosa che alla fine fa), non vi è alcuna garanzia che rimanga minore o uguale a . F f kF fkp(n)1F11/k=33318kp(n)1F1
whuber

Risposte:


9

In un certo senso, ciò che hai fatto è caratterizzare tutte le distribuzioni non negative a valore intero.

Mettiamo da parte la descrizione del processo casuale per un momento e concentriamoci sulle ricorsioni nella domanda.

Se , sicuramente . Se riscriviamo questa seconda ricorsione in termini della funzione di sopravvivenza (dove ha distribuzione ), otteniamo qualcosa di molto suggestivo e facile da gestire. Chiaramente, e quindi Pertanto, fintanto che la nostra sequenza assume valori in e non converge troppo rapidamente a zero, otterremo una funzione di sopravvivenza valida (cioè, diminuendo monotonicamente a zero come ).F n = p n + ( 1 - p n ) F n - 1 S n = 1 - F n = P ( T > n ) T F S n = 1 - F n = ( 1 - p n ) S nfn=pn(1Fn1)Fn=pn+(1pn)Fn1 Sn=1Fn=P(T>n)TFS n = n k = 0 ( 1 - p k )

Sn=1Fn=(1pn)Sn1,
( p n ) [ 0 , 1 ] n
Sn=k=0n(1pk).
(pn)[0,1]n

Più specificamente,

Proposizione : una sequenza assume valori in determina una distribuzione sugli interi non negativi se e solo se e tutte queste distribuzioni hanno una sequenza corrispondente (anche se potrebbe non essere unica).[ 0 , 1 ] - n = 0 log ( 1 - p n ) = (pn)[0,1]

n=0log(1pn)=,

Pertanto, la ricorsione scritta nella domanda è del tutto generale : qualsiasi distribuzione con valore intero non negativo ha una sequenza corrispondente assume valori pari a .[ 0 , 1 ](pn)[0,1]

Tuttavia, il contrario non è vero; cioè ci sono sequenze con valori in che non corrispondono ad alcuna distribuzione valida. (In particolare, considera per tutti e per )(pn)[0,1]0<pn<1nNpn=0n>N

Ma aspetta, c'è di più!

Abbiamo accennato a una connessione con l'analisi della sopravvivenza e vale la pena esplorarla un po 'più a fondo. Nell'analisi di sopravvivenza classica con una distribuzione assolutamente continua e corrispondente densità , la funzione di pericolo è definita come Ff

h(t)=f(t)S(t).

Il rischio cumulativo è quindi e una semplice analisi dei derivati ​​mostra che Da questo, si può immediatamente dare una caratterizzazione di una funzione di rischio ammissibile: È qualsiasi funzione misurabile tale che per tutti e come .Λ(t)=0th(s)ds

S(t)=exp(Λ(t))=exp(0th(s)ds).
hh(t)0t0th(s)dst

Otteniamo una ricorsione simile per la funzione di sopravvivenza a quella sopra notando che pert>t0

S(t)=et0th(s)dsS(t0).

Osservare in particolare che potremmo scegliere come costante a tratti con ogni pezzo di larghezza 1 e tale che l'integrale converga all'infinito. Ciò produrrebbe una funzione di sopravvivenza che corrisponde a qualsiasi intero discreto non negativo desiderato valutato uno per ogni numero intero positivo.h(t)S(t)

Riconnettersi al caso discreto

Per abbinare una discreta desiderata a ciascun numero intero, dovremmo scegliere una funzione di pericolo che sia costante a tratti tale che on . Ciò fornisce una seconda prova della condizione necessaria affinché la sequenza definisca una distribuzione valida.S(n)

h(t)=hn=log(1pn),
(n1,n](pn)

Si noti che, per piccoli , che fornisce una connessione euristica tra la funzione di pericolo di una distribuzione continua e la distribuzione discreta con la corrispondente funzione di sopravvivenza sul interi.pnlog(1pn)pn=fn/Sn1

Postscript : come nota finale, l'esempio nella domanda non soddisfa le condizioni necessarie senza una modifica appropriata a at e l'impostazione per tutti .pn=knfnn=k1fn=0n>k1


1
+1 Molto illuminante. Ma, per quanto riguarda il poscritto, mi sembra che il "troncamento appropriato" si verifichi naturalmente per valori speciali di . Ad esempio, con otteniamo , e più in generale, con otteniamo . kk=1/2f=(0,1/2,1/2,0,)k=1/mf(m+1)=f(m+2)==0
whuber

2
@whuber: avrei dovuto specificare più chiaramente cosa intendevo per "troncamento appropriato". Stavo pensando di troncare (ridurre) il valore di nel punto specificato (in modo che diventi unità). Penso che la nozione sia ancora valida nel caso in cui menzioni, solo che il troncamento non comporterebbe una modifica del valore di . Proverò a chiarire questo in una modifica a breve. Grazie! fnFnfn
cardinale il

2
Bella risposta. Questo è molto penetrante. Ero davvero interessato a vedere questo problema collegato ad altre aree e concetti.
jbarlow,

1
@jbarlow: grazie. Sono contento che l'abbia trovato utile! Mi è piaciuto pensarci un po ', dato che è una bella domanda.
cardinale il

8

Nel caso , abbiamo alcune proprietà note. Siamo in grado di risolvere la relazione di ricorrenzap(n)=p<1

F(n)=p+F(n1)(1p);F(0)=p

ha la soluzione

F(n)=P(Nn)=1(1p)n+1
che è la distribuzione geometrica . È ben studiato

Il caso più generale di probabilmente non può essere calcolato in forma chiusa, e quindi probabilmente non ha una distribuzione nota.p(n)

Altri casi:

  1. p(n)=pn;p<1;F(0)=p ha soluzione che non è una distribuzione comunemente nota.
    F(n)=1(1p)Γ(n+1p)Γ(1p)Γ(n+1)
  2. Definisci (nota come funzione di sopravvivenza nelle statistiche), la relazione di ricorrenza sopra si riduce alla forma più semplice: S(n)=1F(n)
    S(n)=(1p(n))S(n1)
  3. Dal tuo esempio, sembra che tu voglia una funzione che aumenta di . La tua scelta non è eccezionale dal punto di vista analitico a causa dell'interruzione di . Matematici e statistici preferiscono cose lisce . Quindi propongo che e converge a 1. Risolvendo la relazione di ricorrenza con questo , ha la bella forma analitica: Considera . Un dato stat noto è che p(n)np(n)=knp>1
    p(n)=1(1p)n+1p<1
    p(0)=pp(n)S(n)=1-F(n)=(1-p) n + 1
    F(n)=1(1p)n+1n!
    i=0S(i)=E[N]E[N]=(1-p)e(1-p)S(n)=1F(n)=(1p)n+1n!
    i=0S(i)=E[N]
    che, se ricordi qualche calcolo, assomiglia molto alla serie esponenziale di Taylor, quindi
    E[N]=(1p)e(1p)

2
Cam, questa non è la funzione di pericolo, ma piuttosto la funzione di sopravvivenza . :-)
cardinale il

1
ty, * modificato per sopravvivere
Cam.Davidson.Pilon
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.