Come viene definito quando


11

Supponiamo che Y sia una variabile casuale continua e che X sia una discreta.

Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)

Come sappiamo, Pr(Y=y)=0 perché Y è una variabile casuale continua. E sulla base di ciò, sono tentato di concludere che la probabilità Pr(X=x|Y=y) non è definita.

Tuttavia, Wikipedia afferma qui che in realtà è definito come segue:

Pr(X=x|Y=y)=Pr(X=x)fY|X=x(y)fY(y)

Domanda: Qualche idea su come è riuscita Wikipedia a definire quella probabilità?


Il mio tentativo

Ecco il mio tentativo per ottenere quel risultato di Wikipedia in termini di limiti:

Pr(X=x|Y=y)=Pr(X=x)Pr(Y=y|X=x)Pr(Y=y)=limd0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=limd0Pr(X=x)(d×fY|X=x(y))(d×fY(y))=Pr(X=x)fY|X=x(y)fY(y)

Ora, Pr(X=x|Y=y) sembra essere definito come Pr(X=x)fY|X=x(y)fY(y) , che corrisponde che rivendicano Wikipedia.

È così che ha fatto Wikipedia?

Ma sento ancora che sto abusando del calcolo qui. Quindi penso che Pr(X=x|Y=y) non sia definito, ma nel limite il più vicino possibile per definire Pr(Y=y) e Pr(Y=y|X=x) , ma non alla vista, viene definito Pr(X=x|Y=y) .

Ma sono in gran parte incerto su molte cose, incluso il trucco dei limiti che ho fatto lì, sento che forse non sto nemmeno comprendendo appieno il significato di ciò che ho fatto.


1
In effetti, Pr (X = x) = 0 ma la densità di X in xf (x) potrebbe non essere uguale a 0. Non dovresti usare un'etichetta 'autoapprendimento' ??
Lil'Lobster

2
@Lil Per quanto ne so, il tag 'autoapprendimento' è quando si risolvono i compiti. Non lo sto facendo.
cavernicolo

1
La pagina di Wikipedia in realtà si riferisce alla derivazione: en.wikipedia.org/wiki/Bayes'_theorem#Derivation
Ytsen de Boer

3
Temo che la tua derivazione non abbia giustificazioni matematiche come per tutto quando è continuo. y Y YP(Y=y)=0yYY
Xi'an,

Risposte:


10

La distribuzione di probabilità condizionale , , , è formalmente definita come una soluzione dell'equazione dove indica la -algebra associata alla distribuzione di . Una di queste soluzioni è fornita dalla formula di Bayes (1763) come indicato in Wikipedia :x X y Y P ( X = x , Y A ) = A P ( X = x | Y = y ) f Y ( y ) d yP(X=x|Y=y)xXyYσ ( Y ) σ Y P ( X = x | Y = y ) = P ( X = x ) f Y | X = x ( y )

P(X=x,YA)=AP(X=x|Y=y)fY(y)dyAσ(Y)
σ(Y)σY σ ( Y )
P(X=x|Y=y)=P(X=x)fY|X=x(y)fY(y)xX, yY
anche se sono valide anche le versioni che sono arbitrariamente definite su una misura zero impostata in .σ(Y)

Il concetto di probabilità condizionale rispetto a un'ipotesi isolata la cui probabilità è uguale a 0 è inammissibile. Perché possiamo ottenere una distribuzione di probabilità per [la latitudine] sul cerchio meridiano solo se consideriamo questo cerchio come un elemento della decomposizione dell'intera superficie sferica su cerchi meridiani con i poli indicati -  Andrei Kolmogorov

Come mostrato dal paradosso di Borel-Kolmogorov , dato un valore specifico potenzialmente preso , la distribuzione di probabilità condizionale non ha un significato preciso, non solo perché l'evento è di misura zero, ma anche perché questo evento può essere interpretato come misurabile rispetto a un intervallo infinito di -algebre.y0YP(X=x|Y=y0){ω;Y(ω)=y0}σ

Nota: ecco un'introduzione ancora più formale, tratta da una recensione della teoria della probabilità sul blog di Terry Tao :

Definizione 9 (disintegrazione) Sia una variabile casuale con raggio . Una disintegrazione dello spazio campione sottostante rispetto a è un sottoinsieme di di misura completa in (quindi quasi sicuramente), insieme all'assegnazione di una misura di probabilità nel sottospazio di per ogni , che è misurabile nel senso che la mappaYR(R,(μy)yR)ΩYRRμYYRP(|Y=y)Ωy:={ωΩ:Y(ω)=y}ΩyRyP(F|Y=y)è misurabile per ogni evento e tale che per tutti questi eventi, dove è la variabile casuale (quasi sicuramente definita) definita uguale a ogni volta che .F

P(F)=EP(F|Y)
P(F|Y)P(F|Y=y)Y=y

Data tale disintegrazione, possiamo quindi condizionare all'evento per qualsiasi sostituendo con il sottospazio (con l'induzione -algebra), ma sostituendo la misura di probabilità sottostante con . Possiamo quindi condizionare gli eventi (incondizionati) e le variabili casuali a questo evento per creare eventi condizionati e variabili casuali sullo spazio condizionato, dando origine a probabilità condizionaliY=yyRΩΩyσPP(|Y=y)FX(F|Y=y)(X|Y=y)P(F|Y=y)(che è coerente con la notazione esistente per questa espressione) e le aspettative condizionali (assumendo integrabilità assoluta in questo spazio condizionato). Quindi impostiamo come variabile casuale (quasi sicuramente definita) definita uguale ogni volta che .E(X|Y=y)E(X|Y)E(X|Y=y)Y=y


1
Ho già fatto +1, ma ... forse è nitpicking, ma non sarebbe più preciso riferirsi al teorema di Bayes come una formula di Bayes / Laplace ..?
Tim

2
@Tim: grazie, ma non voglio sembrare troppo sciovinista! Ed è un dato di fatto che la formula di Bayes per discreta (Binomiale) e continua (Beta) appare nel documento di Bayes (1763). Naturalmente, Laplace ha impostato il risultato in una generalità molto più ampia. XY
Xi'an,

4

Darò uno schizzo di come i pezzi possono stare insieme quando è continuo e è discreto.YX

La densità mista mista:

fXY(x,y)

Densità e probabilità marginali:

fY(y)=xXfXY(x,y)

P(X=x)=fXY(x,y)dy

Densità condizionale e probabilità:

fYX(yX=x)=fXY(x,y)P(X=x)

P(X=xY=y)=fXY(x,y)fY(y)

Regola di Bayes:

fYX(yX=x)=P(X=xY=y)fY(y)P(X=x)

P(X=xY=y)=fYX(yX=x)P(X=x)fY(y)

Naturalmente, il modo moderno e rigoroso di gestire la probabilità è attraverso la teoria della misura. Per una definizione di precetto, vedi la risposta di Xi'an.


2

Si noti che l'articolo di Wikipedia utilizza effettivamente la seguente definizione: Cioè, esso considera il risultato come una densità, non una probabilità come lo hai tu. Quindi direi che hai ragione che non è definito quando è continuo e discreto, motivo per cui invece consideriamo solo densità di probabilità su in quel caso. P(X=x|Y=y)XYX

fX(x|Y=y)=P(Y=y|X=x)fX(x)p(Y=y)
P(X=x|Y=y)XYX

Modifica: a causa di una confusione sulla notazione (vedi commenti) quanto sopra in realtà si riferisce alla situazione opposta a quella che chiedeva l'uomo delle caverne.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.