"Il concetto di probabilità condizionata rispetto a un'ipotesi isolata la cui probabilità è uguale a 0 è inammissibile." A. Kolmogorov
Per variabili casuali continue, diciamo e , le proprietà condizionali sono definite dalla proprietà che recuperano la misura di probabilità originale, ovvero per tutti gli insiemi misurabili , , Ciò implica che la densità condizionale è definita arbitrariamente su insiemi di misura zero o, in altre parole, che la densità condizionale è definita quasi ovunque . Poiché l'insieme è di misura zero rispetto alla misura di Lebesgue, ciò significa che è possibile definire siaY A ∈ B ( X ) B ∈ B ( Y ) P ( X ∈ A , Y ∈ B ) = ∫ B d P Y ( y ) ∫ B d P X | Y ( x | y ) p X | Y ( x | y ) { 5 , 6 } p (XYA ∈ B( X )B ∈ B( Y )
P (X∈ A , Y∈ B ) = ∫Bd PY( y) ∫Bd PX| Y( x | y)
pX| Y( x | y){ 5 , 6 }p ( 6 ) P ( U = 5 | U ∈ { 5 , 6 } )p ( 5 )e in modi assolutamente arbitrari e quindi che la probabilità può assumere qualsiasi valore.
p ( 6 )P (U= 5 | U∈ { 5 , 6 } )
Ciò non significa che non è possibile definire una densità condizionale con la formula del rapporto come nel caso normale bivariato ma semplicemente che la densità è definita solo quasi ovunque sia per che per .x y
f( y| x)=f( x , y) / f( x )
Xy
"Molti argomenti abbastanza futili hanno imperversato - tra probabilisti altrimenti competenti - su quale di questi risultati sia" corretto "." ET Jaynes
Il fatto che l'argomento limitante (quando va a zero) nella risposta sopra sembra dare una risposta naturale e intuitiva è correlato al paradosso di Borel . La scelta della parametrizzazione nel limite è importante, come mostrato nell'esempio seguente che utilizzo nelle mie lezioni universitarie.ε
Prendi il normale bivariato Qual è la densità condizionale di dato che ?X X = YX, Y~iidN( 0 , 1 )
XX= Y
Se si parte dalla densità articolare , la risposta "intuitiva" è [proporzionale a] . Questo può essere ottenuto considerando la variazione della variabile dove ha la densità . Quindi e Tuttavia , se si considera invece il cambio di variabilela densità marginale di è la densità di Cauchyφ ( x ) 2 ( x , t ) = ( x , y - x ) ∼ φ ( x ) φ ( t + x ) T = Y - X φ ( t / √φ ( x ) φ ( y)φ ( x )2
( x , t ) = ( x , y- x ) ∼ φ ( x ) φ ( t + x )
T= Y- X f(x|t)= φ ( x ) φ ( t + x )φ ( t / 2-√) / 2-√ f(x|t=0)=φ(x)φ(x)f( x | t ) = φ ( x ) φ ( t + x )φ ( t / 2-√) / 2-√
f( x | t = 0 ) = φ ( x ) φ ( x )φ ( 0 / 2-√) / 2-√= φ ( x )22-√
( x , r ) = ( x , y/ x)∼φ(x)φ(rx) | x |
R = Y/ Xψ ( r ) = 1 / π{ 1 + r2} e la densità condizionale di data è Pertanto,
E qui sta il "paradosso": gli eventi e sono uguali a , ma portano a diverse densità condizionali su .
XRf( x | r ) = φ ( x ) φ ( r x ) | x | × π{ 1 + r2}
f( x | r = 1 ) = πφ ( x )2| x | / 2.
R=1T=0X=YX