I bayesiani accettano gli assiomi di Kolmogorov?


24

Di solito la teoria della probabilità viene insegnata con gli assiomi di Kolgomorov. I bayesiani accettano anche gli assiomi di Kolmogorov?


8
La teoria bayesiana segue dagli assiomi standard di probabilità, quindi dagli assiomi di Kolmogorov.
Xi'an,

3
@ Xi'an: che i gradi soggettivi di credenza possano essere rappresentati dalla probabilità non è così ovvio - da qui la domanda, e il lavoro di Ramsey & de Finetti.
Scortchi - Ripristina Monica

2
Ecco perché sono un bayesiano "oggettivo" e inizio con le distribuzioni precedenti definite secondo gli standard della teoria della probabilità ...
Xi'an,

2
Credo che l'interpretazione della probabilità di Cox-Jaynes fornisca una base rigorosa per la probabilità bayesiana. (vedi la mia risposta). Tuttavia, sarebbe bello avere l'opinione di Xi'an su questo.
Summit

1
@Summit: grazie ma temo di non essere molto interessato al problema ...!
Xi'an,

Risposte:


25

Secondo me, l'interpretazione della probabilità di Cox-Jaynes fornisce una base rigorosa per la probabilità bayesiana:

  • Cox, Richard T. "Probabilità, frequenza e aspettative ragionevoli." Rivista americana di fisica 14.1 (1946): 1-13.
  • Jaynes, Edwin T. Teoria della probabilità: la logica della scienza. Pressa universitaria di Cambridge, 2003.
  • Beck, James L. "Identificazione del sistema bayesiano basata sulla logica di probabilità." Controllo strutturale e monitoraggio sanitario 17.7 (2010): 825-847.

Gli assiomi della logica di probabilità derivati ​​da Cox sono:

  1. (P1): (per convenzione)Pr[b|a]0
  2. (P2): Pr[b¯|a]=1Pr[b|a] (funzione di negazione)
  3. (P3): (funzione congiunzione)Pr[bc|a]=Pr[c|ba]Pr[b|a]

Gli assiomi P1-P3 implicano quanto segue (Beck, James L. "Identificazione del sistema bayesiano basata sulla logica di probabilità." Controllo strutturale e monitoraggio sanitario 17.7 (2010): 825-847):

  1. (P4): a) ; b) ; c)Pr [ ¯ b | b c ] = 0 Pr [ b | c ] [ 0 , 1 ]Pr[b|bc]=1Pr[b¯|bc]=0Pr[b|c][0,1]
  2. (P5): a) , b) , dove indica che è contenuto in e significa che è equivalente a .Pr [ a | c ( a b ) ] = Pr [ b | c ( aPr[a|c(ab)]Pr[b|c(ab)]a b a c a b a bPr[un'|c(un'B)]=Pr[B|c(un'B)]un'Bun'cun'Bun'B
  3. (P6):Pr[un'B|c]=Pr[un'|c]+Pr[B|c]-Pr[un'B|c]
  4. (P7): Supponendo che la proposizione afferma che una e una sola delle proposizioni è vera, quindi: b 1 , , b NcB1,...,BN
    • a) Teorema di marginalizzazione:Pr[un'|c]=Σn=1NP[un'Bn|c]
    • b) Teorema della probabilità totale:Pr[un'|c]=Σn=1NPr[un'|Bnc]Pr[Bn|c]
    • c) Teorema di Bayes: per :Pr [ b k |K=1,...,NPr[bk|ac]=Pr[a|bkc]Pr[BK|c]Σn=1NPr[un'|Bnc]Pr[Bn|c]

Implicano l'affermazione della logica di Kolmogorov, che può essere vista come un caso speciale.

Nella mia interpretazione di un punto di vista bayesiano, tutto è sempre (implicitamente) condizionato dalle nostre credenze e dalle nostre conoscenze.

Il seguente confronto è tratto da Beck (2010): Identificazione del sistema bayesiano basata sulla logica di probabilità

Il punto di vista bayesiano

La probabilità è una misura della plausibilità di un'affermazione basata su informazioni specifiche.

  1. Le distribuzioni di probabilità rappresentano stati di conoscenza plausibile di sistemi e fenomeni, non proprietà intrinseche di essi.
  2. La probabilità di un modello è una misura della sua plausibilità rispetto ad altri modelli in un set.
  3. Pragmaticamente quantifica l'incertezza dovuta alla mancanza di informazioni senza alcuna pretesa che ciò sia dovuto alla casualità intrinseca della natura.

Il punto di vista del frequentista

La probabilità è la frequenza relativa di occorrenza di un evento intrinsecamente casuale nel lungo periodo .

  1. Le distribuzioni di probabilità sono proprietà intrinseche di fenomeni casuali.
  2. Ambito limitato, ad es. Nessun significato per la probabilità di un modello.
  3. Si presuppone una casualità intrinseca , ma non può essere dimostrata.

Come derivare gli assiomi di Kolmogorov dagli assiomi sopra

Di seguito, la sezione 2.2 di [Beck, James L. "Identificazione del sistema bayesiano basata sulla logica di probabilità". Controllo strutturale e monitoraggio sanitario 17.7 (2010): 825-847.] È riassunto:

Nel seguito utilizziamo: misura di probabilità sul sottoinsieme di un insieme finito :A XPr(UN)UNX

  1. [K1]:Pr(UN)0,UNX
  2. [K2]:Pr(X)=1
  3. [K3]: se e sono disgiunti.A BPr(UNB)=Pr(UN)+Pr(B),UN,BXUNB

Per derivare (K1-K3) dagli assiomi della teoria della probabilità, [Beck, 2010] ha introdotto propositon che afferma e specifica il modello di probabilità per . [Beck, 2010] introduce inoltre .x πx Pr ( A ) = Pr [ x A | π ]XXXPr(UN)=Pr[XUN|π]

  • P1 implica K1 con ec = πB={XUN}c=π
  • K2 segue da ; P4 (a), e Stati che .π x XPr[XX|π]=1πXX
  • K3 può essere derivato da P6: e sono disgiunti significa che e si escludono a vicenda. Pertanto, K3:B x A x B Pr ( x A B | π ) = Pr ( x A | π ) + Pr ( x B | π )UNBXUNXB Pr(XUNB|π)=Pr(XUN|π)+Pr(XB|π)

5
Dal tuo K3 puoi arrivare a (additività finita) ma non al terzo assioma di Kolmogorov, (additività numerabile) quando le sono elementi di un campo , e non semplicemente sottoinsiemi di un set finito. Pr(io=1nUNio)=Σio=1nPr(UNio)Pr(io=1UNio)=Σio=1Pr(UNio)UNσ
Scortchi - Ripristina Monica

2
@Scortchi KRKoch nella sua introduzione a Bayesian Statistics cita Bernardo e Smith (1994), Bayesian Theory, p. 105, come fonte che mostra come affrontare l'infinito numerabile. Non l'ho verificato, ma come riferimento può anche essere indicato qui.
Scritto il

12

Dopo lo sviluppo della teoria della probabilità, è stato necessario dimostrare che i concetti più vaghi che rispondevano al nome di "probabilità" si adeguavano al concetto rigorosamente definito che avevano ispirato. Le probabilità "soggettive" bayesiane sono state prese in considerazione da Ramsey e de Finetti, che hanno mostrato in modo indipendente che una quantificazione del grado di credenza soggetta ai vincoli di comparabilità e coerenza (le tue convinzioni sono coerenti se nessuno può fare un libro olandese contro di te) deve essere una probabilità.

Le differenze tra assiomatizzazioni sono in gran parte una questione di gusti riguardo a ciò che dovrebbe essere ciò che è definito e ciò che ne deriva. Ma l'additività numerabile è uno di Kolmogorov che non è derivabile da Cox o Finetti, ed è stato controverso. Alcuni bayesiani (ad es. De Finetti e Savage) si fermano all'additività finita e quindi non accettano tutti gli assiomi di Kolmogorov. Possono mettere distribuzioni di probabilità uniformi su intervalli infiniti senza improprietà. Altri seguono Villegas anche assumendo una continuità monotona, e ne ottengono additivi numerabili.

Ramsey (1926), "Verità e probabilità", in Ramsey (1931), Le basi della matematica e altri saggi logici

de Finetti (1931), "Sul significato soggettivo della probabilità", Fundamenta Mathematicæ , 17 , pp 298-325

Villegas (1964), "Sulla probabilità qualitativa -algebras", Ann. Matematica. Statist. , 35 , 4.σ


3
Perché la mia risposta dovrebbe riguardare solo le probabilità "oggettive bayesiane"? Il lavoro fondamentale di Cox (1946) affronta esplicitamente la questione della soggettività! È un documento molto interessante e facile da leggere. Non penso che abbia senso distinguere tra probabilità bayesiane "soggettive" e "oggettive": tutto è sempre implicitamente condizionato alla persona che esegue l'analisi -> e in questo senso "soggettiva".
Summit

riguardo alla derivazione degli assiomi affermava Kolmogorov da Cox: Sono soddisfatto del modo in cui è fatto nella sezione 2.2 di Beck, James L. "Identificazione del sistema bayesiano basata sulla logica di probabilità". Controllo strutturale e monitoraggio sanitario 17.7 (2010): 825-847.
Summit

1
@Summit: (1) Hai ragione; è piuttosto che la visione disposizionale della probabilità di Ramsey & de Finetti li colloca esattamente nel campo "soggettivo", mentre quello di Cox è più generalmente applicabile. (2) Stai dicendo che l'additività numerabile può essere dedotta dai postulati di Cox?
Scortchi - Ripristina Monica

Ho esteso la mia risposta e attendo i tuoi commenti.
Summit

1
@Summit: Grazie - Spero di trovare il tempo di rendere la mia anche la metà accurata. Ho sottolineato il divario tra dove puoi arrivare dal teorema di Cox e gli assiomi "pieni" di Kolmogorov e penso che sia particolarmente pertinente alla domanda (anche se me ne ero completamente dimenticato quando ho risposto per la prima volta). Jaynes aveva alcune cose interessanti da dire su questo BTW.
Scortchi - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.