In primo luogo, non abbiamo bisogno di misure di probabilità, solo -finiteness. Quindi cerchiamo M = ( Ω , F ) sia uno spazio misurabile e lasciare μ e ν essere σ misure -finite su M .σM=(Ω,F)μνσM
Il teorema di Radon-Nikodym afferma che se per tutto A ∈ F , indicato con μ ≫ ν , quindi esiste una funzione di Borel non negativa f tale che
ν ( A ) = ∫ A fμ(A)=0⟹ν(A)=0A∈Fμ≫νf
per tutti A ∈ F .
ν(A)=∫Afdμ
A∈F
Ecco come mi piace pensare a questo. Innanzitutto, per ogni due misure su , definiamo μ ∼ ν per significare μ ( A ) = 0Mμ∼ν . Questa è una relazione di equivalenza valida e diciamo che μ e ν sonoequivalentiin questo caso. Perché questa è una ragionevole equivalenza per le misure? Le misure sono solo funzioni ma i loro domini sono difficili da visualizzare. Che dire se due funzioni ordinarie f , g : R → R hanno questa proprietà, cioè f ( x ) = 0μ(A)=0⟺ν(A)=0μνf,g:R→R ? Bene, definisci
h ( x ) = { f ( x ) / g ( x ) g ( x ) ≠ 0 π e o.w.
e nota che ovunque sul supporto di g abbiamo g h = f , e al di fuori del supporto di g g h = 0 ⋅ π e = 0 = f (poiché ff(x)=0⟺g(x)=0
h(x)={f(x)/g(x)πeg(x)≠0o.w.
ggh=fg gh=0⋅πe=0=ffe
supporti azione) in modo
h ci fa rescale
g in
f . Come sottolinea @whuber, l'idea chiave qui non è che sia in qualche modo "sicuro" da fare o da ignorare, ma piuttosto quando non importa che cosa fa , quindi possiamo semplicemente definirlo arbitrariamente (come essere che non ha alcun significato speciale qui) e le cose funzionano ancora. Anche in questo caso possiamo definire la funzione analoga con modo che .
ghgfg = 0 h π e h ' g / f f h ' = g0/0g=0hπeh′g/ffh′=g
Quindi supponiamo che , ma l'altra direzione non necessariamente regge. Ciò significa che la nostra precedente definizione di funziona ancora, ma ora non funziona poiché avrà divisioni effettive per . Quindi possiamo ridimensionare g in f tramite g h = f , ma non possiamo andare nella direzione opposta perché dovremmo ridimensionare qualcosa 0 in qualcosa diverso da zero.h h ′ 0g(x)=0⟹f(x)=0hh′0gfgh=f0
Ora torniamo a e ν e denotiamo il nostro RND con f . Se μ ∼ ν , ciò significa intuitivamente che uno può essere riscalato nell'altro, e viceversa. Ma in generale vogliamo solo andare in una direzione con questo (cioè ridimensionare una buona misura come la misura di Lebesgue in una misura più astratta), quindi abbiamo solo bisogno di μ ≫ ν per fare cose utili. Questo riscalaggio è il cuore dell'RND.μνfμ∼νμ≫ν
Tornando al punto di @ whuber nei commenti, v'è una sottigliezza in più per il motivo per cui è sicuro di ignorare la questione di . Questo perché con le misure definiamo le cose solo fino a insiemi di misure quindi su qualsiasi insieme con possiamo semplicemente fare in modo che il nostro RND prenda qualsiasi valore, diciamo . Quindi non è che 0 / 0 è intrinsecamente sicuro, ma piuttosto da nessuna parte che avremmo 0 / 0 è un insieme di misura 0 WRT μ in modo che possiamo solo definire il nostro RND essere qualcosa lì bello senza alterare nulla.0/0A μ ( A ) = 0 10Aμ(A)=010/00/00μ
Ad esempio, supponiamo che per alcuni k > 0 . Quindi
ν ( A ) = ∫ Ak⋅μ=νk>0
quindi abbiamo che f ( x ) = k = d ν
ν(A)=∫Adν=∫Akdμ
è l'RND (ciò può essere giustificato in modo più formale dal teorema della modifica delle misure). Questo è positivo perché abbiamo recuperato esattamente il fattore di ridimensionamento.
f(x)=k=dνdμ
Ecco un secondo esempio per sottolineare come il cambiamento di RND su insiemi di misura non li influenza. Sia f ( x ) = φ ( x ) + 1 Q ( x ) , cioè è il PDF normale standard più 1 se l'input è razionale, e sia X un camper con questa densità. Questo significa
P ( X ∈ A ) = ∫ A ( φ + 1 Q )0f(x)=φ(x)+1Q(x)1X= ∫ A φ
P(X∈A)=∫A(φ+1Q)dλ
quindi in realtà
X è ancora un camper gaussiano standard. Non ha influito in alcun modo sulla distribuzione per modificare
X su
Q perché è un insieme di misure
0 wrt
λ .
=∫Aφdλ+λ(Q)=∫Aφdλ
XXQ0λ
X∼Pois(η)Y∼Bin(n,p)PXPYccc(A)=0⟺A=∅
dPYdPX=dPY/dcdPX/dc=fYfX
PY(A)=∫AdPY
=∫AdPYdPXdPX=∫AdPYdPXdPXdcdc
=∑y∈AdPYdPX(y)dPXdc(y)=∑y∈AfY(y)fX(y)fX(y)=∑y∈AfY(y).
P(X=n)>0nY
P≪QμdPdQ=dP/dμdQ/dμ:=p/q