Perché le variabili casuali sono definite come funzioni?


21

Sto riscontrando problemi nel comprendere il concetto di una variabile casuale come funzione. Capisco la meccanica (penso) ma non capisco la motivazione ...

Dire è una tripla di probabilità, dove , è l'algebra di Borel- su quell'intervallo e è la normale misura di Lebesgue. Sia una variabile casuale da a tale che , , ..., , quindi ha una distribuzione uniforme discreta sui valori da 1 a 6. Ω = [ 0 , 1 ] B σ P X B { 1 , 2 , 3 , 4 , 5 , 6 } X ( [ 0 , 1 / 6 ) ) = 1 X ( [ 1 / 6 , 2 / 6 ) ) = 2 x ( [(Ω,B,P)Ω=[0,1]BσPXB{1,2,3,4,5,6}X([0,1/6))=1X([1/6,2/6))=2XX([5/6,1])=6X

Va bene, ma non capisco la necessità della tripla probabilità originale ... avremmo potuto costruire direttamente qualcosa di equivalente come dove è tutta l'appropriata -algebra dello spazio e è una misura che assegna a ciascun sottoinsieme la misura (# di elementi) / 6. Inoltre, la scelta di era arbitraria-- avrebbe potuto essere o qualsiasi altro set.S σ P x Ω = [ 0 , 1 ] [ 0 , 2 ]({1,2,3,4,5,6},S,PX)SσPXΩ=[0,1][0,2]

Quindi la mia domanda è: perché preoccuparsi di costruire un arbitrario con un -algebra e una misura e definire una variabile casuale come una mappa dal -algebra alla linea reale? σ σΩσσ


5
Si noti che la variabile casuale è la funzione da a , non da a . Il requisito è che la variabile casuale sia misurabile rispetto a . R B R BΩRBRB
mpiktas,

Risposte:


21

Se ti stai chiedendo perché tutto questo macchinario viene utilizzato quando potrebbe essere sufficiente qualcosa di molto più semplice, hai ragione, per le situazioni più comuni. Tuttavia, la versione teorica della misura della probabilità è stata sviluppata da Kolmogorov allo scopo di stabilire una teoria di tale generalità da poter gestire, in alcuni casi, spazi di probabilità molto astratti e complicati. In effetti, le basi teoriche di misura di Kolmogorov per la probabilità alla fine hanno consentito di applicare strumenti probabilistici ben oltre il loro dominio di applicazione originale previsto in aree come l'analisi armonica.

All'inizio sembra più semplice saltare qualsiasi "sottostante" -algebra Ω , e semplicemente assegnare masse di probabilità agli eventi che comprendono direttamente lo spazio del campione, come hai proposto. In effetti, i probabilisti fanno effettivamente la stessa cosa ogni volta che scelgono di lavorare con la "misura indotta" sullo spazio campione definito da P X - 1 . Tuttavia, le cose iniziano a diventare difficili quando inizi a entrare in spazi dimensionali infiniti. Supponiamo che tu voglia provare la Legge forte dei grandi numeri per il caso specifico di lanciare monete giuste (cioè che la proporzione di teste tende arbitrariamente vicino a 1/2 mentre il numero di gettoni di monete va all'infinito). Potresti provare a costruire un σσΩPX-1σ-algebra sul set di sequenze infinite di forma . Ma qui può scoprire che è molto più conveniente considerare lo spazio sottostante come Ω = [ 0 , 1 ) ; e quindi utilizzare le rappresentazioni binarie di numeri reali (ad es. 0,10100 ... ) per rappresentare sequenze di lanci di monete (1 essendo teste, 0 essendo code.) Un'illustrazione di questo esempio può essere trovata nei primi capitoli della Probabilità di Billingsley e Misura .(H,T,H,...)Ω=[0,1)0,10,1 mille ...


Grazie! Controllerò quel libro. Tuttavia, poiché è ancora arbitrario (potrebbe anche essere stato [ 0 , 2 ) nel tuo esempio, è l'intervallo di unità [ 0 , 1 ] o [ 0 , 1 ) lo spazio 'preferito' che funzionerà in tutte le circostanze ? Oppure ci sono situazioni in cui un Ω più complicato , come R 2, sarebbe utile? Ω[0,2)[0,1][0,1)ΩR2
Leo Vasquez,

2
@Leo: Sì. I processi stocastici a tempo continuo forniscono un esempio. L'esempio canonico è il moto browniano, in cui lo spazio campione è considerato C , lo spazio di tutte le funzioni continue a valore reale. ΩC
cardinale

1
@NRH, Sì, avrei dovuto dire che può essere preso anziché preso . Stavo (in qualche modo intenzionalmente) cercando di spazzolarlo sotto il tappeto.
cardinale

1
@cardinal, nel commento di @ Leo è stato chiesto se fosse "preferito" in tutte le circostanze. Sto solo dicendo che l'IMO non esiste Ω e che è utile non richiedere nulla su Ω in generale. Quando si desidera lavorare con un esempio specifico, potrebbero esserci motivi per scegliere uno Ω specifico . Si noti, tuttavia, che la "tautologia" sta spazzando sotto il tappeto che l' esistenza del moto browniano come misura di probabilità su C deve essere stabilita. [0,1]ΩΩΩC
NRH

2
@NRH, scusami per la mia lentezza mentale oggi. Non ero riuscito a collegare il riferimento preferito al commento precedente di @ Leo. Grazie. Per quanto riguarda l'osservazione della "tautologia", il mio punto era che in altre costruzioni, la continuità dei percorsi di campionamento è un teorema , mentre, sotto la costruzione a base con mappa d'identità, è tautologico. Ovviamente, il fatto che BM possa essere costruita in questo modo deve prima essere dimostrato. Ma questo è un po 'a parte il punto. C
cardinale

10

I problemi riguardanti le algebre sono sottigliezze matematiche, che non spiegano veramente perché o se abbiamo bisogno di uno spazio di fondo . Anzi, direi che non ci sono prove convincenti che lo spazio sullo sfondo sia una necessità. Per qualsiasi impostazione probabilistica ( E , E , μ ) dove E è lo spazio campionario, E la σ -algebra e μ una misura di probabilità, l'interesse è in μ , e non c'è ragione astratta che vogliamo μ essere la misura dell'immagine di una mappa misurabile X : ( Ω , Bσ(E,E,μ)EEσμμμ .X:(Ω,B)(E,E)

Tuttavia, l'uso di uno spazio di sfondo astratto offre una comodità matematica che rende molti risultati più naturali e intuitivi. L'obiettivo è sempre quello di dire qualcosa su , la distribuzione di X , ma può essere più facile e più chiaramente espresso in termini di X .μXX

Un esempio è dato dal teorema del limite centrale. Se sono iid reali valutati con media μ e varianza σ 2 il CLT dice che P ( X1,...,Xnμσ2 doveΦè la funzione di distribuzione per la distribuzione normale standard. Se la distribuzione diXièμ,il risultato corrispondente in termini di misura indica ρ

P(nσ(1nΣio=1nXio-ξ)X)Φ(X)
ΦXioμ È necessaria una spiegazione della terminologia. Perμnintendiamo laconvoluzionen-volte diμ(la distribuzione della somma). Le funzioniρcsono le funzioni lineariρc(x)=cxe
ρn/στξρ1/n(μ*n)((-,X])Φ(X)
μ*nnμρcρc(X)=cX è la traduzione τ ξ ( x ) = x - ξ . Probabilmente ci si potrebbe abituare alla seconda formulazione, ma fa un buon lavoro nel nascondere di cosa si tratta.τξτξ(X)=X-ξ

Ciò che sembra essere il problema è che le trasformazioni aritmetiche coinvolte nel CLT sono chiaramente espresse in termini di variabili casuali ma non si traducono così bene in termini di misure.


(+1) Buona descrizione. Penso che l'altro motivo per cui la precedente notazione è così popolare sia che si traduce più naturalmente in nozioni intuitive nelle applicazioni. (Votato diverse ore fa.)
cardinale

@cardinale, grazie per aver chiarito questo punto. Sembra più naturale pensare e discutere in termini di una somma di variabili, non di una convoluzione di misure di probabilità, e vorremmo che la matematica riflettesse ciò.
NRH,

0

Di recente mi sono imbattuto in questo nuovo modo di pensare alla variabile casuale e allo spazio di sfondo Ω . Non sono sicuro che questa sia la domanda che stavi cercando, in quanto non è un motivo matematico, ma penso che fornisca un modo molto semplice di pensare ai camper.XΩ

Immagina una situazione in cui lanciamo una moneta. Questa configurazione sperimentale consiste in un insieme di possibili condizioni iniziali che includono la descrizione fisica di come viene lanciata la moneta. Lo spazio di sfondo è costituito da tutte quelle possibili condizioni iniziali. Per ragioni di semplicità, potremmo supporre che i lanci di monete variano solo in velocità, quindi impostiamo Ω=[0,vmun'X]

La variabile casuale può quindi essere pensata come una funzione che mappa ogni stato iniziale ω Ω con il corrispondente risultato dell'esperimento, cioè se si tratta di code o testa.XωΩ

Per il camper: la misura Q corrisponderebbe quindi alla misura di probabilità sulle condizioni iniziali, che insieme alla dinamica dell'esperimento rappresentato da XX:([0,vmun'X],B[0,vmun'X],Q)({0,1},2{0,1})QX determina la distribuzione della probabilità sugli esiti.

Per riferimento a questa idea puoi guardare i capitoli di Tim Maudlin o Micheal Strevens in "Probabilties in Physics" (2011)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.