Uguale o diverso? La via bayesiana


10

Di 'che ho il seguente modello:

Poisson(λ){λ1if t<τλ2if tτ

E dai miei dati i posteriori di e mostrati di seguito. Esiste un modo bayesiano di dire (o quantificare) se e sono uguali o diversi ?λ 2 λ 1 λ 2λ1λ2λ1λ2

Forse misurando la probabilità che sia diverso daλ 2λ1λ2 ? O forse usando le divergenze di KL?

Ad esempio, come posso misurare , o almeno, ?p ( λ 2 > λ 1 )p(λ2λ1)p(λ2>λ1)

In generale, una volta che hai i lati mostrati di seguito (assume valori PDF diversi da zero ovunque per entrambi), qual è un buon modo per rispondere a questa domanda?

inserisci qui la descrizione dell'immagine

Aggiornare

Sembra che a questa domanda si possa rispondere in due modi:

  1. Se abbiamo campioni dei posteriori, potremmo guardare la frazione dei campioni in cui λ1λ2 (o equivalentemente λ2>λ1 ). @ Cam.Davidson.Pilon includeva una risposta che avrebbe risolto questo problema utilizzando tali campioni.

  2. Integrazione di una sorta di differenza dei posteriori. E questa è una parte importante della mia domanda. Come sarebbe quella integrazione? Presumibilmente l'approccio di campionamento approssimerebbe questo integrale, ma vorrei conoscere la formulazione di questo integrale.

Nota: i grafici sopra provengono da questo materiale .


Puoi semplicemente calcolare la varianza di entrambe le distribuzioni e aggiungerle. Questa è la varianza della differenza nei mezzi. Quindi calcola la differenza nei mezzi e vedi quante deviazioni standard è. È possibile approssimare entrambe le distribuzioni con normale per iniziare e utilizzare i soliti intervalli di confidenza per una distribuzione normale. Sono mezzi chiaramente diversi.
Dave31415,


3
Tutti i calcoli richiesti sono forniti nel mio documento ma non ho studiato il caso di ( ϕ è il rapporto tra i due tassi di Poisson)H0:{ϕ=1}ϕ
Stéphane Laurent,

Grazie @ StéphaneLaurent. Il tuo documento è un ottimo indicatore, ma sembra essere specifico per i processi di Poisson. Qual è il confronto, ad alto livello, che un bayesiano può fare per stimare se è uguale o diverso da λ 1 ? L'analisi deve essere specifica per la distribuzione? λ2λ1
Amelio Vazquez-Reina,

2
Scusa @ user023472 Non ho energia in questi giorni. Vedi i documenti di Bernardo citati nel mio documento. "Intrinseco" significa che il metodo è derivato e solo dal modello.
Stéphane Laurent,

Risposte:


7

Penso che una domanda migliore sia: sono significativamente differenti?

Per rispondere a questo, dobbiamo calcolare . Chiama questa quantità p . Se p 0,50 , allora c'è la stessa possibilità che uno sia più grande dell'altro. D'altra parte, se p è davvero vicino a 1, allora possiamo essere certi che λ 2 è più grande (leggi: diverso) di λ 1 .P(λ2>λ1)pp0.50pλ2λ1

Come calcoliamo ? È banale in un framework MCMC bayesiano. Abbiamo campioni dalla parte posteriore, quindi calcoliamo semplicemente il chace che i campioni da λ 2 sono più grandi di λ 1 :pλ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Mi scuso per non aver incluso questo nel libro, lo aggiungerò sicuramente perché penso che sia una delle idee più utili nell'inferenza bayesiana


5
La probabilità è 1.0 che siano differenti, in quanto sono entrambe variabili casuali continue. Considera: qual è la tua ipotesi precedente che ? Pensi davvero che siano effettivamente uguali? (Ignora il test delle ipotesi: viviamo nel mondo reale in cui le variabili non sono mai effettivamente uguali). Vedi questo post del mio eroe, Gelman. Dal punto di vista computazionale, puoi testarlo elaborando . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon

1
P(|λ1λ2|>1)P(λ1λ2)

3
λ1λ2λ2λ1

1
oddio, odierei essere in quella situazione! Implica integrali cattivi. Per la maggior parte dei modelli, in realtà non è possibile ricavare i posteriori. Anche se tu potessi, potrebbe essere meglio usare un computer, solo per ottenere campioni. In sintesi, esempi> formule per calcoli come questo.
Cam.Davidson.Pilon

2
Non stai misurando "sufficientemente grande". Considera una distribuzione con un picco a zero e un'altra con masse uguali a picchi -10, 10. La tua statistica - il valore atteso dell'indicatore che un campione è più grande dell'altro - dà 0,5, ma le distribuzioni sono chiaramente totalmente diverse.
Neil G,

5

λ1λ2Pr(λ1=λ2)=0

λ1λ2ϵ[ϵ/2,ϵ/2]

λ2>λ1


Grazie. In che modo la tua risposta si collega ad alcune delle idee discusse nei commenti del PO?
Amelio Vazquez-Reina,

Mi scuso, ma non ho familiarità con nessuno di questi metodi, quindi non posso commentare in modo significativo. @ Stéphane_Laurent è piuttosto intelligente, però, quindi ti consiglio di consultare almeno il link.
Sycorax dice Ripristina Monica il

1
@ user023472 Mi dispiace non avere l'energia oggi per dare una risposta sull'approccio alla discrepanza intrinseca. Si basa sulla divergenza di Kullback-Leibler.
Stéphane Laurent,

ϵp(λ2>λ1)p(λ2λ1)

Grazie @ user777. Sono interessato al caso in cui non abbiamo accesso ai campioni. Prima avevi un integrale nel tuo post, ma sembra che tu l'abbia eliminato. Come sarebbe quell'integrale?
Amelio Vazquez-Reina,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.