TRATTAMENTO INFORMALE
Dobbiamo ricordare che la notazione in cui ci condizioniamo su variabili casuali è inaccurata, sebbene economica, come notazione. In realtà condizioniamo sulla sigma-algebra che generano queste variabili casuali. In altre parole, E[Y∣X] significa E[Y∣σ(X)] . Questa osservazione può sembrare fuori posto in un "Trattamento informale", ma ci ricorda che le nostre entità condizionanti sono raccolte di insiemi (e quando condizioniamo su un singolo valore, allora questo è un insieme singleton). E cosa contengono questi set? Contengono le informazionicon cui i valori possibili della variabile casuale X ci forniscono su ciò che può accadere con la realizzazione di Y .
Introdurre il concetto di Informazione, ci permette di pensare (e usare) la Legge delle aspettative iterate (a volte chiamata "Proprietà della Torre") in un modo molto intuitivo:
la sigma-algebra generata da due variabili casuali, è almeno come grande come quello generato da una variabile casuale: σ(X)⊆σ(X,Z) nel significato proprio set-teorico. Quindi le informazioni su Y contenute in σ(X,Z) è grande almeno quanto le informazioni corrispondenti inσ(X) .
Ora, come allusione notazionale, impostaσ(X)≡Ix eσ(X,Z)≡Ixz . Quindi è possibile scrivere l'LHS dell'equazione che stiamo osservando
Descrivendo verbalmente l'espressione precedente abbiamo: "qual è l'aspettativa di {il valore atteso di Y dato Informazioni I x z } dato che abbiamo informazioni disponibilisolo I x ?"
E[E(Y|Ixz)|Ix]
YIxzIx
Possiamo in qualche modo "prendere in considerazione" ? No - sappiamo solo che x . Ma se usiamo ciò che abbiamo (poiché siamo obbligati dall'espressione che vogliamo risolvere), allora essenzialmente diciamo cose su Y sotto l'operatore delle aspettative, cioè diciamo " E ( Y ∣ I x ) ", non più - abbiamo appena esaurito le nostre informazioni.IxzIxYE(Y∣Ix)
Quindi
E[ E( Y| iox z) | ioX] = E( Y| ioX)
Se qualcun altro non lo farà, tornerò per il trattamento formale.
UN TRATTAMENTO FORMALE (poco più)
Vediamo come due libri molto importanti di teoria della probabilità, Probability and Measure di P. Billingsley (3d ed.-1995) e D. Williams "Probability with Martingales" (1991), trattano la questione della dimostrazione della "Legge delle aspettative alterate":
Billingsley dedica esattamente tre righe alla dimostrazione. Williams, e cito, dice
"(la proprietà della torre) è praticamente immediato dalla definizione di aspettativa condizionale".
Questa è una riga di testo. La prova di Billingsley non è meno opaca.
Ovviamente hanno ragione: questa proprietà importante e molto intuitiva delle aspettative condizionate deriva essenzialmente direttamente (e quasi immediatamente) dalla sua definizione: l'unico problema è, sospetto che questa definizione non sia di solito insegnata, o almeno non evidenziata, al di fuori della probabilità o misurare i circoli teorici. Ma per mostrare in (quasi) tre righe che la Legge delle aspettative iterate tiene, abbiamo bisogno della definizione di aspettativa condizionale, o meglio, della sua proprietà che definisce .
Lasciare uno spazio di probabilità , e una variabile casuale integrabile Y . Lasciate che G sia un sub σ -algebra di F , G ⊆ F . Quindi esiste una funzione W che è G misurabile, integrabile e (questa è la proprietà che definisce)( Ω , F, P )YsolσFsol⊆ FWsol
E(W⋅1G)=E(Y⋅1G)∀G∈G[1]
dove è la funzione indicatrice dell'insieme G . Diciamo che W è ("una versione di") l'attesa condizionale di Y dato G , e scriviamo
W = E ( Y ∣ G )1GGWYG
Il dettaglio importante notare qui è che l'aspettativa condizionale, ha lo stesso valore atteso come Y fa, non solo su tutta G ,ma in ogni sottoinsieme G di G .W=E(Y∣G)a.s.
YGGG
(Proverò ora a presentare come la proprietà Tower deriva dalla definizione di aspettativa condizionale).
è unavariabile casuale misurabile G. Consideriamo poi alcuni sub σ -algebra, dire H ⊆ G . Poi G ∈ H ⇒ G ∈ G . Quindi, in modo analogo come in precedenza, abbiamo l'aspettativa condizionale di W dato H , diciamo U = E ( W ∣ H )WGσH⊆GG∈H⇒G∈GWHche è caratterizzato da U=E(W∣H)a.s.
E(U⋅1G)=E(W⋅1G)∀G∈H[2]
Da , le equazioni [ 1 ] e [ 2 ] ci dannoH⊆G[1][2]
E(U⋅1G)=E(Y⋅1G)∀G∈H[3]
Ma questa è una caratteristica distintiva del valore atteso condizionato di dato H . YHQuindi abbiamo il diritto di scrivere
Dato che abbiamo anche per costruzione U = E ( W ∣ H ) = E ( E [ Y ∣ G ] ∣ H ) , abbiamo appena dimostrato la proprietà della Torre, o la forma generale della Legge delle aspettative iterate - in otto righe.U=E(Y∣H)a.s.
U= E( W∣ H ) = E( E[ Y∣ G] ∣ H )