Rapporto di probabilità vs rapporto di PDF


12

Sto usando Bayes per risolvere un problema di clustering. Dopo aver fatto alcuni calcoli, finisco con la necessità di ottenere il rapporto tra due probabilità:

P(A)/P(B)

per essere in grado di ottenere P(H|D) . Queste probabilità sono ottenute dall'integrazione di due diversi KDE multivariati 2D come spiegato in questa risposta :

P(A)=x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdy
P(B)=x,y:g^(x,y)<g^(rb,sb)g^(x,y)dxdy

dove f^(x,y) e g^(x,y) sono i KDE e l'integrazione viene eseguita per tutti i punti al di sotto delle soglie f^(ra,sa) e g^(rb,sb) . Entrambi i KDE usano un kernel gaussiano . Un'immagine rappresentativa di un KDE simile a quelli con cui sto lavorando può essere vista qui: Integrazione dello stimatore di densità del kernel in 2D .

Calcolo i KDE mediante una pythonfunzione stats.gaussian_kde , quindi presumo il seguente modulo generale per esso:

KDE(x,y)=1ni=1n12h2e(xxi)2+(yyi)22h2

dov'è nla lunghezza della mia serie di punti ed hè la larghezza di banda utilizzata.

Gli integrali sopra sono calcolati applicando un processo Monte Carlo che è piuttosto costoso dal punto di vista computazionale. Ho letto da qualche parte (ho dimenticato dove, scusate) che in casi come questo è possibile sostituire il rapporto delle probabilità con il rapporto dei PDF (KDE) valutati ai punti di soglia per ottenere risultati altrettanto validi. Sono interessato a questo perché calcolare il rapporto di KDE è ordini di grandezza più veloci del calcolo del rapporto degli integrali con MC.

Quindi la domanda si riduce alla validità di questa espressione:

P(A)P(B)=f^(ra,sa)g^(rb,sb)

In quali circostanze, se ce ne sono, posso dire che questa relazione è vera?

[errore di battitura fisso (EDIT)]


Aggiungi :

Questa è sostanzialmente la stessa domanda, ma fatta in una forma più matematica .


1
Si noti che l'esistenza del appropriato è assicurata dal teorema a valore medio per gli integrali. ra,b,sa,b
Dave,

1
Credo che il Mills Ratio possa essere rilevante.
whuber

@whuber quel rapporto apparentemente richiede che io conosca il valore di P(X)ciò che sto cercando di evitare di calcolare. Potresti espandere un po 'la pertinenza di quel parametro?
Gabriel,

Risposte:


3

KDE è una miscela di distribuzioni normali. Diamo un'occhiata a uno solo di essi.

Le definizioni di e mostrano che i loro valori sono invarianti rispetto alle traduzioni e ai riscalamenti nel piano, quindi è sufficiente considerare la distribuzione normale standard con PDF . La disuguaglianzaP ( B )P(A)P(B)f

f(x,y)f(r,s)

è equivalente a

x2+y2r2+s2.

L'introduzione delle coordinate polari consente di riscrivere l'integraleρ,θ

P(r,s)=12π02πr2+s2ρexp(ρ2/2)dρdθ=exp((r2+s2)/2)=2πf(r,s).

Ora considera la miscela. Perché è lineare,

P(r,s)=1ni2πf((rxi)/h,(syi)/h)=2πh2(1ni1h2f((rxi)/h,(syi)/h))=2πh2KDE(r,s).

In effetti, e sono proporzionali. La costante di proporzionalità è .fP2πh2


Che una relazione di proporzionalità tra e sia specialePf può essere apprezzata contemplando un semplice controesempio. Lascia che abbia una distribuzione uniforme su un set misurabile dell'area dell'unità e abbia una distribuzione uniforme su un set misurabile che è disgiunto da e ha area . Quindi la miscela con PDF ha valore costante su , su ed è zero altrove. Vi sono tre casi da considerare:f1A1f2A2A1μ>1f=f1/2+f2/21/2A11/(2μ)A2

  1. (r,s)A1 . Qui raggiunge il suo massimo, da cui . Il rapporto .f(r,s)=1/2P(r,s)=1f(r,s)/P(r,s)=1/2

  2. (r,s)A2 . Qui è strettamente inferiore a ma maggiore di . Pertanto la regione di integrazione è il complemento di e l'integrale risultante deve essere uguale a . Il rapporto .f(r,s)1/20A11/2f(r,s)/P(r,s)=(1/(2μ))/(1/2)=1/μ

  3. Altrove, è zero e integrale è zero.fP

Evidentemente il rapporto (dove è definito) non è costante e varia tra e . Sebbene questa distribuzione non sia continua, può essere effettuata aggiungendo una distribuzione normale ad essa. Riducendo entrambi gli autovalori di , questo cambierà la distribuzione molto poco e produrrà qualitativamente gli stessi risultati - solo ora i valori del rapporto includeranno tutti i numeri nell'intervallo .11/μ1(0,Σ)Σf/P[1,1/μ]


Anche questo risultato non si generalizza ad altre dimensioni. In sostanza lo stesso calcolo che ha dato il via a questa risposta mostra che è una funzione Gamma incompleta e che chiaramente non è la stessa di . Che due dimensioni siano speciali si può notare osservando che l'integrazione in riguarda essenzialmente le distanze e quando queste sono normalmente distribuite, la funzione di distanza ha una distribuzione - che è la distribuzione esponenziale. La funzione esponenziale è unica in essendo proporzionale al proprio derivato - dove l'integrando ed integrale devono essere proporzionali.PfPχ2(2)fP


Questa è una risposta incredibilmente veloce, grazie mille. Mi ci vorrà un po 'per elaborare completamente tutto ciò che hai scritto qui, ma mi fido completamente dei tuoi calcoli, il che significa che ho contrassegnato la domanda come risolta. Saluti.
Gabriel,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.