Intuizione per l'attesa condizionale di -algebra


20

Sia uno spazio di probabilità, data una variabile casuale e un -algebra possiamo costruire una nuova variabile casuale , che è l'aspettativa condizionale.( Ω , F , μ ) (Ω,F,μ)ξ : Ω Rξ:ΩR σ σGFGF E [ ξ | G ]E[ξ|G]


Qual è esattamente l'intuizione per pensare a ? Comprendo l'intuizione per quanto segue:E [ ξ | G ]E[ξ|G]

(i) dove è un evento (con probabilità positiva).E [ ξ | A ] E[ξ|A]AA

(ii) dove è una variabile casuale discreta.E [ ξ | η ] E[ξ|η]ηη

Ma non riesco a visualizzare . Ne comprendo la matematica e capisco che è definito in modo tale da generalizzare i casi più semplici che possiamo visualizzare. Tuttavia, non trovo utile questo modo di pensare. Rimane un oggetto misterioso per me.E [ ξ | G ]E[ξ|G]


Ad esempio, lascia che sia un evento con . Formare il -algebra , quello generato da . Quindi sarebbe uguale a \ frac {1} {\ mu (A)} \ int_A \ xi if \ omega \ in A , e uguale a \ frac {1 } {\ mu (a ^ c)} \ int_ {a ^ c} \ xi se \ omega \ non \ in a . In altre parole, E [\ xi | \ mathscr {G}] (\ omega) = E [\ xi | A] if \ omega \ in A ed E [\ xi | \ mathscr {G}] (\ omega) = E [\ xi | A ^ c] if \ omega \ in A ^ c .A Aμ ( A ) > 0 μ(A)>0σ σG = { , A , A c , Ω } G={,A,Ac,Ω}AA E [ ξ | G ] ( ω ) E[ξ|G](ω)1μ ( A )A ξ 1μ(A)Aξω A ωA1μ ( A c )Acξ1μ(Ac)AcξωAωAE[ξ| G](ω)=E[ξ| A]E[ξ|G](ω)=E[ξ|A]ωAωAE[ξ| G](ω)=E[ξ| Ac]E[ξ|G](ω)=E[ξ|Ac]ωAcωAc

La parte che confonde è quella ω ΩωΩ , quindi perché non scrivere semplicemente E [ ξ |G ] ( ω ) = E [ ξ | Ω ] = E [ ξ ]E[ξ|G](ω)=E[ξ|Ω]=E[ξ] ? Perché sostituiamo E [ ξ | G ]E[ξ|G] con E [ ξ | A  o  A c ]E[ξ|A or Ac] seconda che ω AωA , ma non sia autorizzato a sostituire E [ ξ | G ]E[ξ|G] con E [ ξ ]E[ξ] ?


Nota. Nel rispondere a questa domanda non spiegarlo usando la definizione rigorosa di aspettativa condizionale. Lo capisco. Quello che voglio capire è ciò che si suppone stia calcolando l'aspettativa condizionale e perché rifiutiamo uno al posto di un altro.

Risposte:


16

Un modo di pensare alla rappresentazione condizionale è come una proiezione sul -algebra .σσ GG

inserisci qui la descrizione dell'immagine( dai beni comuni di Wikimedia )

Questo è in realtà rigorosamente vero quando si parla di variabili casuali integrabili al quadrato; in questo caso è in realtà la proiezione ortogonale della variabile casuale sul sottospazio di costituito da variabili casuali misurabili rispetto a . E in effetti questo risulta addirittura vero in un certo senso per variabili casuali tramite approssimazione di variabili casuali.E [ ξ | G ] ξ L 2 ( Ω ) GE[ξ|G]ξL2(Ω)G L 1 L 2L1L2

(Vedi i commenti per i riferimenti.)

Se si considera algebre come rappresentante quante informazioni abbiamo a disposizione (un'interpretazione che è di rigore nella teoria dei processi stocastici), allora algebre più grandi significano più eventi possibili e quindi più informazioni sui possibili risultati, mentre più piccoli algebre significano meno eventi possibili e quindi meno informazioni sui possibili risultati.σ - σ - σ -σσσ

Pertanto, proiettare la variabile casuale sulla più piccola algebra significa prendere la nostra migliore ipotesi sul valore di date le informazioni più limitate disponibili da .F ξ σ - G ξ GFξσGξG

In altre parole, date solo le informazioni da e non tutte le informazioni da , è in senso rigoroso il nostro meglio possibile indovinare quale sia la variabile casuale .G F E [ ξ | G ] ξGFE[ξ|G]ξ


Per quanto riguarda il tuo esempio, penso che potresti confondere le variabili casuali e i loro valori. Una variabile casuale è una funzione il cui dominio è lo spazio eventi; non è un numero. In altre parole, , mentre per un , .X X : Ω R X { f | f : Ω R } ω Ω X ( ω ) RXX: Ω R  X{ f | f : Ω R }ω ΩX( ω ) R

La notazione per aspettativa condizionale, secondo me, è davvero pessima, perché è una variabile casuale stessa, cioè anche una funzione . Al contrario, l'aspettativa (regolare) di una variabile casuale è un numero . L'aspettativa condizionale di una variabile casuale è una quantità completamente diversa dall'aspettativa della stessa variabile casuale, vale a dire, non fa nemmeno "controllo del tipo" con .E [ ξ | G ] E [ ξ ]E[ξ|G]E[ξ]

In altre parole, usare il simbolo per indicare sia l'aspettativa regolare che quella condizionale è un abuso di notazione molto grande, che porta a una confusione molto inutile.EE

Detto questo, nota che è un numero (il valore della variabile casuale valutato al valore ), ma è una variabile casuale, ma risulta essere una variabile casuale costante (cioè banale degenerata), perché -algebra generato da , è banale / degenerato, e quindi tecnicamente parlando il valore costante di questa costante variabile casuale, è , dove quiE [ ξ | G ] ( ω ) E [ ξ | G ] ω E [ ξ | Ω ] σ Ω { , Ω }E[ξ|G](ω)E[ξ|G]ωE[ξ|Ω]σΩ{,Ω} E [ ξ ] EE[ξ]E denota aspettativa regolare e quindi un numero, non aspettativa condizionale e quindi non una variabile casuale.

Inoltre sembra che tu sia confuso su cosa significhi la notazione ; tecnicamente parlando è possibile solo condizionare su algebre, non su singoli eventi, poiché le misure di probabilità sono definite solo su algebre complete , non su singoli eventi. Così, è solo (pigro) scorciatoia per , dove sta per il algebra generata dall'evento , che è . Nota che ; in altre parole, ,E [ ξ | A ] σ - σ - E [ ξ | A ] E [ ξ | σ ( A ) ] σ ( A ) σ - A { , A , A c , Ω } σ ( A ) = G = [ ξ |E[ξ|A]σσE[ξ|A]E[ξ|σ(A)]σ(A)σA{,A,Ac,Ω} σ ( A c )σ(A)=G=σ(Ac) E [ ξ | A ] EE[ξ|A]G ] E [ ξ | A c ]E[ξ|G] e sono tutti modi diversi di indicare esattamente lo stesso oggetto .E[ξ|Ac]

Infine, voglio solo aggiungere che la spiegazione intuitiva che ho dato sopra spiega perché il valore costante della variabile casuale è solo il numero - la algebra rappresenta la minor quantità possibile di informazioni che potremmo avere, in realtà essenzialmente nessuna informazione, quindi in questa circostanza estrema la migliore ipotesi che potremmo avere per quale variabile casuale è la variabile casuale costante il cui valore costante è .E [ ξ | Ω ] = E [ ξ | σ ( Ω ) ] = E [ ξ | { , Ω } ] E [ ξ ] σ - { , Ω }E[ξ|Ω]=E[ξ|σ(Ω)]=E[ξ|{,Ω}]E[ξ]σ{,Ω} ξξ E [ ξ ]E[ξ]

Si noti che tutte le variabili casuali costanti sono variabili casuali e sono tutte misurabili rispetto alla banale -algebra , quindi effettivamente abbiamo la costante random è la proiezione ortogonale di sul sottospazio di costituito da variabili casuali misurabili rispetto a , come è stato affermato.L 2 σ { , Ω } E [ ξ ] ξ L 2 ( Ω ) { , Ω }L2σ{,Ω}E[ξ]ξL2(Ω){,Ω}


2
@William Non sono d'accordo con te sull'uso di come var varato. Molti libri definiscono un numero, non un var varato. È la migliore stima possibile di . Questa è una nozione utile e altamente intuitiva. Ignorarlo completamente, solo perché si ha una nozione generalizzata di cond exp poiché un var varato è sbagliato dal punto di vista pedagogico. Non sono confuso su cosa sia un camper, né vedo come tutto ciò che ho scritto ti avrebbe portato a pensare in quel modo. E [ ξ | A ] E [ ξ | A ] ξ | UNE[ξ|A]E[ξ|A]ξ|A
Nicolas Bourbaki,

1
@William Pensare a cond expe come una stima della corsa var con rappresenta le informazioni, è qualcosa che ho visto prima ma non ci ho mai pensato tanto e ho cercato di trovare un modo diverso di visualizzare cond expec. Usando il tuo suggerimento, scriverò un semplice esempio e lo pubblicherò come risposta, per me e per le altre persone. Forse alcune persone possono quindi elaborare il mio esempio e dare uno più esotico. solG
Nicolas Bourbaki,

1
@NicolasBourbaki Vi consiglio di dare un'occhiata a p.221 della 4a edizione di Durrett's Probability - Theory and Esempi . Posso riferirti anche ad altre fonti che ne discutono. In ogni caso, non è proprio una questione di opinione - nel caso più generale, un'aspettativa condizionale è una variabile casuale e il condizionamento viene fatto solo rispetto a algebre; il condizionamento rispetto a un evento è condizionamento rispetto alla algebra generata dall'evento, e il condizionamento rispetto a una variabile casuale è il condizionamento rispetto alla -algebra generata dal camperσ - σ - σσσσ
Chill2Macht il

3
@William E posso riferirti a fonti che definiscono il cond. exep. di un evento per essere un numero reale. Non so perché sei così bloccato su questo punto. Si può definirlo in ogni modo, purché le nozioni non siano confuse. Per motivi pedagogici, insegnare una lezione su prob. la teoria, e saltare istantaneamente nella definizione più generale, non è illuminante. In entrambi i casi, in questa discussione non importa davvero, e il tuo reclamo riguarda notazione / semantica.
Nicolas Bourbaki,

1
@NicolasBourbaki Il capitolo 5 di Probabilità di Whittle attraverso l'attesa fornisce un ottimo resoconto (secondo me) di entrambe le caratterizzazioni di aspettativa condizionale, e spiega bene come ogni definizione si collega e è motivata dall'altra definizione. Hai ragione sul fatto che la distinzione è un'altra della semantica. Il mio entusiasmo per la definizione più generale deriva (penso) dalla lettura di questo capitolo (5 di Probabilità di Whittle attraverso l'attesa ), che ha reso (credo) buoni argomenti su come la definizione più generale sia in qualche modo più facile da capire.
Chill2Macht,

3

Proverò a elaborare ciò che William ha suggerito.

Lascia che sia lo spazio campione del lancio di una moneta due volte. Definisci la corsa. var. per essere il num. di teste che si verificano nell'esperimento. Chiaramente, . Un modo di pensare a ciò che , come expec. valore, rappresenta è la migliore stima possibile per . Se dovessimo provare a indovinare quale valore avrebbe assunto , indovineremmo . Questo perché per qualsiasi numero reale .Ω ξ E [ ξ ] = 1 1 ξΩξE[ξ]=11ξ ξ 1 E [ ( ξ - 1 ) 2 ] Eξ1 [ ( ξ - a ) 2 ] aE[(ξ1)2]E[(ξa)2]a

Indica che è l'evento che il primo risultato è un testa. Sia essere il -alg. gen. by . Pensiamo a come a rappresentare ciò che sappiamo dopo il primo lancio. Dopo il primo lancio, si sono verificate le teste o non si sono verificate teste. Quindi, siamo o nell'evento o dopo il primo lancio.A = { H T , H H } G = { , A , A c , Ω } σ A GA={HT,HH}G={,A,Ac,Ω}σAGA A cAAc

Se siamo nell'evento , allora la migliore stima possibile per sarebbe , e se siamo nell'evento , allora la migliore stima possibile per sarebbe .A ξAξE [ ξ | A ] = 1,5 A c ξ EE[ξ|A]=1.5Acξ [ ξ |A c ] = 0,5E[ξ|Ac]=0.5

Ora definisci la corsa. var. per essere sia o a seconda se o meno . Questo ha funzionato. var. , è un'approssimazione migliore di poiché .η ( ω ) 1,5 0,5 ω A η 1 = E [ ξ ] E [ ( ξ - η ) 2 ] Eη(ω)1.50.5ωAη1=E[ξ] [ ( ξ - 1 ) 2 ]E[(ξη)2]E[(ξ1)2]

Quello che sta facendo è fornire la risposta alla domanda: qual è la migliore stima di dopo il primo lancio? Dal momento che non sappiamo le informazioni dopo il primo lancio, dipenderà . Una volta che l'evento viene rivelato, dopo il primo lancio, viene determinato il valore di e fornisce la migliore stima possibile per . η ξ η AηξηA G η ξGηξ

Il problema con l'utilizzo di come propria stima, ovvero è il seguente. non è ben definito dopo il primo lancio. Supponiamo che il risultato dell'esperimento sia con il primo risultato in testa, siamo nell'evento , ma cos'èNon sappiamo fin dal primo lancio, che il valore è ambiguo per noi e quindi non è ben definito. Più formalmente, diciamo che non è cioè il suo valore non è ben definito dopo il primo lancio. Pertanto, è la migliore stima possibile diξ 0 = E [ ( ξ - ξ ) 2 ] E [ ( ξ - η ) 2 ] ξ ω A ξ ( ω ) = ? ξ ξ G η ξξ0=E[(ξξ)2]E[(ξη)2] dopo il primo lancio.

Forse qualcuno qui può trovare un esempio più sofisticato usando lo spazio campione , con e po 'non banale -algebra.[ 0 , 1 ] ξ ( ω ) = ω G σ


1

Sebbene tu richieda di non usare la definizione formale, penso che la definizione formale sia probabilmente il modo migliore per spiegarla.

Wikipedia - aspettativa condizionale :

Quindi un'aspettativa condizionale di X dato , indicato come , è qualsiasi -measurable function ( ) che soddisfa:H E(X H ) H Ω R n

H E(X H )d P = H Xd Pper ciascunoH H

Innanzitutto, è una funzione misurabile . In secondo luogo, deve corrispondere alle aspettative su ogni (sotto) set misurabile in . Quindi, per un evento, A, la sigma algebra è , quindi è chiaramente impostata come specificato nella domanda per . Analogamente per qualsiasi variabile casuale discreta (e combinazioni di esse), elenchiamo tutti gli eventi primitivi e assegniamo l'attesa data quell'evento primitivo.H H {A,AC,,Ω}ωA/Ac

Ora considera di lanciare una moneta un numero infinito di volte, dove ad ogni lancio i ottieni , se la tua moneta è croce allora le tue vincite totali sono dove = 1 per le code e 0 per le teste. Quindi X è una variabile casuale reale su . Dopo n lanci di monete, conosci il valore di X con precisione , ad es. Dopo 2 lanci di monete è in [0,1 / 4], [1 / 4,1 / 2], [1/2, 3/4] o [3 / 4,1] - dopo ogni lancio della moneta, la tua sigma algebra associata diventa sempre più sottile, e allo stesso modo l'aspettativa condizionale di X sta diventando sempre più precisa.1 / 2 i X = Σ i = 1 12 i cici[0,1]1/2n

Speriamo che questo esempio di una variabile aleatoria a valore reale con una sequenza di sigma algebre che diventa sempre più fine (Filtrazione) ti allontani dall'intuizione puramente basata sugli eventi a cui sei abituato, e chiarisce il suo scopo.


Mi scuso, ma ho votato in negativo questa domanda. Non risponde a ciò che ho chiesto originariamente. Né fornisce nuove informazioni che non conoscevo prima.
Nicolas Bourbaki,

Quello che sto cercando di suggerirti è che non capisci la definizione formale così come pensi di fare (come suggerito anche dall'altra risposta), quindi a meno che tu non lavori attraverso ciò che non è intuitivo con la definizione formale non progredirai.
seanv507,

Capisco bene la definizione formale. Le domande che ho posto, so come rispondere quando lavoro dalle definizioni formali. L '"altra risposta" stava cercando di spiegare la mia domanda senza usare la definizione di con. exp.
Nicolas Bourbaki,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.