Come modellare una moneta distorta con distorsione temporale?


10

I modelli di monete di parte hanno in genere un parametro . Un modo per stimare da una serie di estrazioni è usare una beta precedente e calcolare la distribuzione posteriore con probabilità binomiale.θθ=P(Head|θ)θ

Nelle mie impostazioni, a causa di uno strano processo fisico, le proprietà della mia moneta stanno lentamente cambiando e diventa una funzione del tempo . I miei dati sono un insieme di estrazioni ordinate, ad esempio . Posso considerare che ho solo un pareggio per ogni su una griglia temporale discreta e regolare.t { H , T , H , H , H , T , . . . } tθt{H,T,H,H,H,T,...}t

Come lo modelleresti? Sto pensando a qualcosa come un filtro Kalman adattato al fatto che la variabile nascosta è e mantiene la probabilità binomiale. Cosa potrei usare per modellare per mantenere tracciabile l'inferenza?P ( θ ( t + 1 ) | θ ( t ) )θP(θ(t+1)|θ(t))

Modifica le seguenti risposte (grazie!) : Vorrei modellare come una catena di Markov di ordine 1 come avviene nei filtri HMM o Kalman. L'unica ipotesi che posso fare è che sia regolare. Potrei scrivere con un piccolo rumore gaussiano (idea del filtro di Kalman), ma questo spezzerebbe il requisito che deve rimanere in . Seguendo l'idea di @J Dav, potrei usare una funzione probit per mappare la linea reale su , ma ho l'intuizione che ciò darebbe una soluzione non analitica. Una distribuzione beta con meanθ ( t ) P ( θ ( t + 1 ) | θ ( t ) ) = θ ( t ) + ϵ ϵ θ [ 0 , 1 ] [ 0 , 1 ] θ ( t )θ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ[0,1][0,1]θ(t) e una varianza più ampia potrebbe fare il trucco.

Sto ponendo questa domanda poiché ho la sensazione che questo problema sia così semplice che deve essere stato studiato in precedenza.


È possibile ottenere una stima se si dispone di un modello su come varia la percentuale di successo nel tempo. Molti modelli diversi funzionerebbero e le stime potrebbero variare molto in base al modello ipotizzato. Non credo che la trattabilità sia un criterio pratico per la scelta di un modello. Vorrei capire il processo e cercare un modello che dimostri caratteristiche che concordano con il comportamento che ci si aspetta.
Michael R. Chernick, il

@MichaelChernick: grazie. L'unica ipotesi che posso fare è che si sta muovendo senza intoppi e lentamente. Inoltre la tracciabilità è un criterio importante poiché in realtà voglio estendere la soluzione al caso multivariato con interdipendenze non banali. Una soluzione ideale sarebbe analitica e fornire l'aggiornamento "online" delle stime dei parametri quando arrivano nuovi dati. θ
replicato2 il

1
Puoi quantificare cosa intendi con " si sta muovendo senza intoppi e lentamente?" Gli interi sono discreti e ci sono funzioni smooth che assumono valori arbitrari sugli interi, il che significa che la smoothness non ha vincoli. Alcune nozioni di "lentamente" non danno ancora alcun vincolo, mentre altre lo fanno. θ
Douglas Zare,

Quanto è veloce "lentamente", come una variazione della probabilità di 0,1 / unità di tempo o 0,001 o ... E quanto tempo ti aspetti di avere una sequenza? L'intervallo è relativamente ridotto (ad es. 0,2 - 0,4) o si avvicina a (0,1)?
jbowman,

@DouglasZare Con 'smooth', volevo affermare che E [θ_t + 1 | θ_t] = θ_t (o molto vicino) e VAR (θ_t + 1 | θ_t) è piccolo. θ non sta saltando in giro (altrimenti nulla potrebbe essere fatto davvero).
replicato2 il

Risposte:


2

Dubito che tu possa trovare un modello con soluzione analitica, ma l'inferenza può ancora essere resa trattabile usando gli strumenti giusti poiché la struttura delle dipendenze del tuo modello è semplice. Come ricercatore di machine learning, preferirei utilizzare il seguente modello in quanto l'inferenza può essere resa piuttosto efficiente usando la tecnica della propagazione delle aspettative:

Sia il risultato del -esimo processo. Definiamo il parametro variabile nel tempotX(t)t

η(t+1)N(η(t),τ2) per .t0

Per collegare con , introdurre variabili latentiη(t)X(t)

Y(t)N(η(t),β2) ,

e modello essereX(t)

Y ( t ) 0 X ( t ) = 0 Y ( t ) P [ X ( t ) = 1 ] = Φ ( η ( t ) / β ) Φ θ ( t ) = η ( t ) / βX(t)=1 se e altrimenti. Puoi effettivamente ignorare e emarginarli per dire semplicemente , (con cdf di standard normale) ma l'introduzione di variabili latenti rende facile l'inferenza. Inoltre, nota che nella tua parametrizzazione originale .Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

Se sei interessato a implementare l'algoritmo di inferenza, dai un'occhiata a questo documento . Usano un modello molto simile in modo da poter adattare facilmente l'algoritmo. Per capire l'EP la seguente pagina può essere utile. Se sei interessato a perseguire questo approccio fammi sapere; Posso fornire consigli più dettagliati su come implementare l'algoritmo di inferenza.


0

Per elaborare il mio commento un modello come p (t) = p exp (-t) è un modello semplice che consente di stimare p (t) stimando p utilizzando la stima della massima verosimiglianza. Ma la probabilità decade davvero in modo esponenziale. Questo modello sarebbe chiaramente sbagliato se si osservano periodi di tempo con alta frequenza di successo rispetto a quanto osservato in precedenza e in tempi successivi. Il comportamento oscillatorio potrebbe essere modellato come p (t) = p | sint |. Entrambi i modelli sono molto trattabili e possono essere risolti con la massima probabilità ma offrono soluzioni molto diverse.000


1
Sembra che l'OP stia cercando di modellare la probabilità di successo al tempo , , come un processo markoviano, di non specificare una forma funzionale per . tθ(t)θ(t)
Macro,

1
@macro ha ragione, non sono in grado di fornire una forma parametrica per , e questo non è desiderabile poiché questa funzione potrebbe essere qualcosa di liscio. Voglio un modello Markov di ordine 1 simile a un modello Markov nascosto o a un filtro Kalman, ma con una variabile nascosta che assume valori reali tra 0 e 1 e con una probabilità Bernouilli. theta(t)
replicato2 il

@pierre Ok prima della modifica sembrava che stavi cercando di stimare il tempo che variava p e stavi solo suggerendo l'HMM come un possibile approccio. Non stavo raccomandando un modulo funzionale per il modo in cui cambia con t. Stavo sottolineando che senza ulteriori informazioni potevano essere costruiti molti modelli di vario tipo e i miei due esempi dovevano dimostrare che senza ulteriori informazioni le scelte dei modelli potevano dare risposte molto diverse. Perché dovresti insistere su un HMM? Se uno ha funzionato e si adatta ai tuoi dati, perché rifiutarli perché è "non analitico.
Michael R. Chernick,

Sto suggerendo che trovare soluzioni convenienti non è il modo di risolvere problemi statistici pratici!
Michael R. Chernick,

1
@MichaelChernick Infine: vorrei trovare una soluzione analitica poiché spero che questo sia un problema ben noto e la gente ha proposto una soluzione analitica abbastanza flessibile. Ma sono d'accordo con il nostro suggerimento che modellare la "dinamica reale" è più importante del costo computazionale in generale. Purtroppo questo è per i big data e un lento algo sarà inutile :-(
repied2

0

La tua probabilità cambia con ma come diceva Michael, non sai come. linearmente o no? Sembra un problema di selezione del modello in cui la tua probabilità :tp

p=Φ(g(t,θ)) può dipendere da una funzione altamente non lineare . è solo una funzione di delimitazione che garantisce tra 0 e 1 probabilità.g(t,θ)Φ

Un semplice approccio esplorativo sarebbe quello di provare diverse prove per con diversi non lineari e di eseguire una selezione del modello basata su criteri informativi standard.Φg()g()

Per rispondere alla sua ri-eddited domanda:

Come hai detto, l'utilizzo di probit implicherebbe solo soluzioni numeriche, ma potresti invece utilizzare una funzione logistica:

Funzione logistica:P[θ(t+1)]=11+exp(θ(t)+ϵ)

Linearizzato da:logP1P=θ(t)+ϵ

Non sono sicuro di come possa funzionare con l'approccio del filtro Kalman, ma credo ancora che una specifica non lineare come o molte altre senza un termine casuale lo farà Fai il lavoro. Come puoi vedere questa funzione è "smoth", nel senso che è continua e differenziabile. Sfortunatamente l'aggiunta di genererebbe salti della probabilità risultante che è qualcosa che non vuoi, quindi il mio consiglio sarebbe di eliminare .ϵ ϵθ(t+1)=at3+bt2+ct+dϵϵ

Probabilità di accesso:P[Coint+1=H|t]=11+exp(θ(t))

Hai già delle casualità nell'evento bernoulli (Markov Chain) e ne stai aggiungendo un'altra fonte grazie a . Pertanto, il problema potrebbe essere risolto come Probit o Logit stimato dalla massima probabilità con come variabile esplicativa. Suppongo che tu sia d'accordo sul fatto che tale parsimonia è molto importante. A meno che il tuo obiettivo principale sia applicare un determinato metodo (HMM e Kalman Filter) e non fornire la soluzione valida più semplice al tuo problema.tϵt


Se si utilizza un probit, un'estensione multivariata è semplice in quanto è possibile stimare un probit multivariato. Le dipendenze sarebbero implicite dalla matrice di covarianza della distribuzione normale multivariata implicita.
JDav,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.