Perché abbiamo bisogno di sigma-algebre per definire gli spazi di probabilità?


122

Abbiamo un esperimento casuale con risultati diversi che formano lo spazio campione sul quale guardiamo con interesse a determinati schemi, chiamati eventiLe sigma-algebre (o campi sigma) sono costituite da eventi ai quali è possibile assegnare una misura di probabilità . Alcune proprietà sono soddisfatte, tra cui l'inclusione del set nullo e dell'intero spazio di campionamento e un'algebra che descrive i sindacati e le intersezioni con i diagrammi di Venn.Ω,F . P F. P

La probabilità è definita come una funzione tra -algebra e l'intervallo . Complessivamente, il triplo forma uno spazio di probabilità .σ[0,1](Ω,F,P)

Qualcuno potrebbe spiegare in parole povere perché l'edificio di probabilità sarebbe crollato se non avessimo un -algebra? Sono appena incastrati nel mezzo con quella "F" impossibilmente calligrafica. Confido che siano necessari; Vedo che un evento è diverso da un risultato, ma cosa andrebbe storto senza un -algebras?σσ

La domanda è: in quale tipo di problemi di probabilità la definizione di uno spazio di probabilità che include un -algebra diventa una necessità?σ


Questo documento online sul sito web della Dartmouth University fornisce una semplice spiegazione accessibile in inglese. L'idea è un puntatore rotante che ruota in senso antiorario su un cerchio di perimetro unitario :

inserisci qui la descrizione dell'immagine

Iniziamo costruendo un filatore, che consiste in un cerchio di circonferenza unitaria e un puntatore, come mostrato nella [figura]. Selezioniamo un punto sul cerchio ed etichettiamo , quindi etichettiamo ogni altro punto sul cerchio con la distanza, diciamo , da a quel punto, misurata in senso antiorario. L'esperimento consiste nel girare il puntatore e registrare l'etichetta del punto sulla punta del puntatore. Lasciamo che la variabile casuale denoti il ​​valore di questo risultato. Lo spazio campione è chiaramente l'intervallo0x0X[0,1)0 0 0 0 1. Vorremmo costruire un modello di probabilità in cui sia probabile che si verifichi ogni risultato. Se procediamo come abbiamo fatto per [...] esperimenti con un numero finito di risultati possibili, allora dobbiamo assegnare la probabilità a ciascun risultato, poiché altrimenti la somma delle probabilità, su tutti i possibili risultati, non uguale a 1. (In effetti, sommare un numero non numerabile di numeri reali è un affare complicato; in particolare, affinché tale somma abbia un significato, al massimo numerabilmente molti dei riassunti possono essere diversi da ). Tuttavia, se tutte le probabilità assegnate sono , quindi la somma è , non , come dovrebbe essere.00001

Quindi, se assegnassimo ad ogni punto qualsiasi probabilità, e dato che esiste un numero infinito (non numerabile) di punti, la loro somma si sommerebbe a .>1


9
Sembra autolesionista chiedere risposte su campi che non menzionano la teoria delle misure! σ
Xi'an,

5
L'ho fatto, però ... Non sono sicuro di aver capito il tuo commento.
Antoni Parellada,

8
Sicuramente la necessità di campi sigma non è solo una questione di opinione ... Penso che questo possa essere considerato sull'argomento qui (secondo me).
gung

8
Se il tuo bisogno di teoria della probabilità è limitato a "teste" e "code", allora chiaramente non è necessario per -fields! σ
Xi'an

26
Penso che questa sia una buona domanda. Così spesso nei libri di testo si vedono riferimenti completamente superflui alle triple di probabilità che l'autore continua a ignorare completamente in seguito. (Ω,F,P)
dsaxton

Risposte:


124

Al primo punto di Xi'an: quando parli di -algebre, stai chiedendo insiemi misurabili, quindi purtroppo ogni risposta deve concentrarsi sulla teoria delle misure. Cercherò di risolverlo delicatamente, però.σ

Una teoria della probabilità che ammette tutti i sottoinsiemi di insiemi non numerabili romperà la matematica

Considera questo esempio. Supponiamo di avere un quadrato unitario in e che tu sia interessato alla probabilità di selezionare casualmente un punto che è un membro di un insieme specifico nel quadrato unitario. In molte circostanze, è possibile rispondere prontamente a questo in base a un confronto tra aree delle diverse serie. Ad esempio, possiamo disegnare alcuni cerchi, misurare le loro aree e quindi prendere la probabilità come la frazione del quadrato che cade nel cerchio. Molto semplice.R2

Ma cosa succede se l'area dell'insieme di interesse non è ben definita?

Se l'area non è ben definita, allora possiamo ragionare su due conclusioni diverse ma completamente valide (in un certo senso) su cosa sia l'area. Quindi potremmo avere da un lato e dall'altro, il che implica . Questo rompe tutta la matematica oltre ogni riparazione. Ora puoi provare e un numero di altre cose assurde. Chiaramente questo non è troppo utile.P ( A ) = 0 0 = 1 5 < 0P(A)=1P(A)=00=15<0

σ -algebre sono la patch che risolve la matematica

Che cosa è un -algebra, precisamente? In realtà non è così spaventoso. È solo una definizione di quali set possono essere considerati eventi. Gli elementi non presenti in semplicemente non hanno una misura di probabilità definita. Fondamentalmente, -algebre sono la "patch" che ci consente di evitare alcuni comportamenti patologici della matematica, vale a dire insiemi non misurabili.F σσFσ

I tre requisiti di un campo possono essere considerati come conseguenze di ciò che vorremmo fare con probabilità: Un campo è un insieme che ha tre proprietà:σσσ

  1. Chiusura sotto sindacati numerabili.
  2. Chiusura sotto incroci numerabili.
  3. Chiusura sotto complementi.

Le unioni numerabili e le componenti intersezioni numerabili sono conseguenze dirette del problema dell'insieme non misurabile. La chiusura sotto complementi è una conseguenza degli assiomi di Kolmogorov: se , dovrebbe essere . Ma senza (3), potrebbe accadere che non sia definito. Sarebbe strano. La chiusura sotto complementi e gli assiomi di Kolmogorov ci permettono di dire cose come .P(A)=2/3P(Ac)1/3P(Ac)P(AAc)=P(A)+1P(A)=1

Infine, stiamo prendendo in considerazione eventi in relazione a , quindi richiediamo ulteriormente cheΩΩF

Buone notizie: -algebre sono strettamente necessarie solo per i set non numerabiliσ

Ma! Ci sono anche buone notizie qui. O, almeno, un modo per aggirare il problema. Abbiamo solo bisogno di -algebras se stiamo lavorando in un set con innumerevoli cardinalità. Se ci limitiamo a set numerabili, allora possiamo prendere il set di potenze di e non avremo nessuno di questi problemi perché per numerabili , consiste solo di set misurabili. (Questo è accennato nel secondo commento di Xi'an.) Noterai che alcuni libri di testo in realtà commetteranno un gioco di prestigio sottile qui, e considereranno insiemi numerabili solo quando discutiamo di spazi di probabilità.σF=2ΩΩΩ2Ω

Inoltre, nei problemi geometrici in , è perfettamente sufficiente considerare solo -algebre composte di insiemi per i quali è definita la misura . Per radicare questo in qualche modo più saldamente, per corrisponde alle solite nozioni di lunghezza, area e volume. Quindi quello che sto dicendo nell'esempio precedente è che l'insieme deve avere un'area ben definita per avere una probabilità geometrica assegnata ad esso. E la ragione è questa: se ammettiamo insiemi non misurabili, allora possiamo finire in situazioni in cui possiamo assegnare la probabilità 1 a un evento in base a una prova e la probabilità 0 allo stesso evento in base a un'altra prova. σ L n L n n=1,2,3RnσLnLnn=1,2,3

Ma non lasciare che la connessione a insiemi non numerabili ti confonda! Un malinteso comune che -algebre sono insiemi numerabili. In effetti, possono essere numerabili o non numerabili. Considera questa illustrazione: come prima, abbiamo un quadrato unitario. DefinisciPuoi disegnare un quadrato con la lunghezza laterale per tutti i e con un angolo in . Dovrebbe essere chiaro che questo quadrato è un sottoinsieme del quadrato dell'unità. Inoltre, tutti questi quadrati hanno un'area definita, quindi questi quadrati sono elementi di . Ma dovrebbe anche essere chiaro che ci sono innumerevoli quadratiF = Tutti i sottoinsiemi del quadrato dell'unità con  misura L 2 definita  . B s s ( 0 , 1 ) ( 0 , 0 ) F Bσ

F=All subsets of the unit square with defined L2 measure.
Bss(0,1)(0,0)FB : il numero di tali quadrati non è numerabile e ogni quadrato ha definito la misura di Lebesgue.

Quindi, in pratica, semplicemente fare quell'osservazione è spesso sufficiente per rendere l'osservazione che si considerano solo insiemi misurabili di Lebesgue per fare progressi contro il problema di interesse.

Ma aspetta, cos'è un set non misurabile?

Temo di poter fare solo un po 'di luce su questo da solo. Ma il paradosso Banach-Tarski (a volte il paradosso "sole e piselli") può aiutarci:

Data una palla solida nello spazio tridimensionale, esiste una decomposizione della palla in un numero finito di sottoinsiemi disgiunti, che possono quindi essere riuniti in un modo diverso per produrre due copie identiche della palla originale. In effetti, il processo di riassemblaggio prevede solo lo spostamento dei pezzi e la loro rotazione, senza modificarne la forma. Tuttavia, i pezzi stessi non sono "solidi" nel senso comune, ma infinite dispersioni di punti. La ricostruzione può funzionare con un minimo di cinque pezzi.

Una forma più forte del teorema implica che dati due oggetti solidi "ragionevoli" (come una pallina e una pallina enorme), l'uno o l'altro possono essere riassemblati nell'altro. Questo è spesso dichiarato in modo informale come "un pisello può essere tagliato e riassemblato nel Sole" e chiamato "paradosso del pisello e del sole". 1

Quindi se stai lavorando con le probabilità in e stai usando la misura della probabilità geometrica (il rapporto dei volumi), vuoi calcolare la probabilità di qualche evento. Ma avrai difficoltà a definire quella probabilità con precisione, perché puoi riorganizzare i set del tuo spazio per cambiare i volumi! Se la probabilità dipende dal volume e puoi modificare il volume del set in modo che sia la dimensione del sole o la dimensione di un pisello, anche la probabilità cambierà. Quindi nessun evento avrà una singola probabilità attribuita ad esso. Ancora peggio, puoi riorganizzare tale che il volume di abbia , il che implica che la misura della probabilità geometrica riporta una probabilità SΩSV(S)>V(Ω)P(S)>1R3SΩSV(S)>V(Ω)P(S)>1, in flagrante violazione degli assiomi di Kolmogorov che richiedono che la probabilità abbia la misura 1.

Per risolvere questo paradosso, si potrebbe fare una delle quattro concessioni:

  1. Il volume di un set potrebbe cambiare quando viene ruotato.
  2. Il volume dell'unione di due insiemi disgiunti potrebbe essere diverso dalla somma dei loro volumi.
  3. Gli assiomi della teoria degli insiemi Zermelo – Fraenkel con l'assioma della scelta (ZFC) potrebbero dover essere modificati.
  4. Alcuni set potrebbero essere contrassegnati come "non misurabili" e si dovrebbe verificare se un set è "misurabile" prima di parlare del suo volume.

L'opzione (1) non aiuta a definire le probabilità, quindi è fuori. L'opzione (2) viola il secondo assioma di Kolmogorov, quindi è uscito. L'opzione (3) sembra un'idea terribile perché ZFC risolve molti più problemi di quanti ne crei. Ma l'opzione (4) sembra interessante: se sviluppiamo una teoria di ciò che è e non è misurabile, avremo probabilità ben definite in questo problema! Questo ci riporta alla teoria della misura e al nostro amico -algebra.σ


5
La ringrazio per la risposta. sta per Lebesque misurabile? Farò +1 sulla tua risposta sulla fede, ma apprezzerei molto se tu potessi abbassare il livello di matematica diverse tacche ... :-)L
Antoni Parellada

7
(+1) Buoni punti! Aggiungo anche che senza misura e algebre di , il condizionamento e la derivazione delle distribuzioni condizionate su spazi non numerabili diventano piuttosto pelosi, come dimostra il paradosso di Borel-Kolmogorov . σ
Xi'an

2
@ Xi'an Grazie per le belle parole! Significa davvero molto, venire da te. Non avevo familiarità con il paradosso di Borel-Kolmogorov al momento della stesura di questo scritto, ma farò qualche lettura e vedrò se riuscirò a fare un'utile aggiunta delle mie scoperte.
Sycorax

3
@ Student001: penso che stiamo dividendo i capelli qui. Hai ragione a dire che la definizione generale di "misura" (qualsiasi misura) è data usando il concetto di sigma-algebre. Il mio punto, tuttavia, è che non esiste una parola o un concetto di "sigma-algebra" nella definizione della misura di Lebesgue fornita nel mio primo collegamento. In altre parole, si può definire la misura di Lebesgue secondo il mio primo collegamento, ma poi bisogna dimostrare che si tratta di una misura e questa è la parte difficile. Concordo tuttavia sul fatto che dovremmo interrompere questa discussione.
Amoeba,

3
Mi è davvero piaciuto leggere la tua risposta. Non so come ringraziarti, ma hai chiarito molto le cose! Non ho mai studiato analisi reali né avuto una corretta introduzione alla matematica. È venuto da un background di ingegneria elettrica che si è concentrato molto sull'implementazione pratica. L'hai scritto in termini così semplici che un tipo come me potrebbe capirlo. Apprezzo molto la tua risposta e la semplicità che hai fornito. Grazie anche a @ Xi'an per i suoi commenti affollati!
Zushauque,

19

L'idea di base (in termini molto pratici) è semplice. Supponiamo che tu sia uno statistico che lavora con alcuni sondaggi. Supponiamo che il sondaggio abbia alcune domande sull'età, ma chiedi al rispondente di identificare la sua età solo in alcuni intervalli, come . Dimentichiamo le altre domande. Questo questionario definisce uno "spazio eventi", il tuo . La sigma algebra codifica tutte le informazioni che possono essere ottenute dal questionario, quindi, per la domanda sull'età (e per ora ignoriamo tutte le altre domande), conterrà l'intervallo ma non altri intervalli come[0,18),[18,25),[25,34),(Ω,F)F[18,25)[20,30), poiché dalle informazioni ottenute dal questionario non possiamo rispondere a domande come: l'età degli intervistati appartiene a o no? Più in generale, un set è un evento (appartiene a ) se e solo se possiamo decidere se un punto campione appartiene o meno a quel set.[20,30)F

Ora, definiamo variabili casuali con valori nel secondo spazio eventi, . Ad esempio, prendi questa come la vera linea con la solita sigma-algebra (di Borel). Quindi, una funzione (non interessante) che non è una variabile casuale è "l'età degli intervistati è un numero primo", codificandola come 1 se l'età è il numero primo, 0 altrimenti. No, non appartiene a , quindi non è una variabile casuale. Il motivo è semplice, non possiamo decidere dalle informazioni nel questionario se l'età del rispondente è ottima o no! Ora puoi fare tu stesso esempi più interessanti. (Ω,F)f:f1(1)Ff

Perché richiediamo che sia una sigma algebra? Diciamo che vogliamo porre due domande sui dati, "è il rispondente numero 3 di 18 anni o più", "il rispondente 3 è una donna". Lascia che le domande definiscano due eventi (serie in ) e , le serie di punti campione che danno una risposta "sì" a quella domanda. Ora facciamo la congiunzione delle due domande "è responsabile 3 una donna di età pari o superiore a 18 anni". Ora questa domanda è rappresentata dalla serie di intersezione . Allo stesso modo, le disgiunzioni sono rappresentate dal set unioneF A B A B A BFFABABAB. Ora, richiedere la chiusura per intersezioni e unioni numerabili ci consente di chiedere congiunzioni o disgiunzioni numerabili. E negare una domanda è rappresentato dall'insieme complementare. Questo ci dà una sigma-algebra.

Ho visto questo tipo di introduzione prima nell'ottimo libro di Peter Whittle "Probabilità via aspettativa" (Springer).

MODIFICARE

iiσσnσnσ

Ma abbiamo davvero bisogno della legge forte dei grandi numeri? Secondo una risposta qui , forse no.

nn

σ


4
σP(A)[20,30)P(A)[20,30)P(A)[18,34)ben definito, quindi non è nemmeno chiaro che questo esempio illustri ciò che si desidera.
Sycorax

5
σσ

2
σ

3
Penso che la tua discussione sia valida. Alla fine, però, sono rimasto un po 'sorpreso quando ho incontrato questa affermazione: "richiedere la chiusura per intersezioni e unioni numerabili ci permette di chiedere congiunzioni o disgiunzioni numerabili". Questo sembra essere al centro del problema: perché qualcuno dovrebbe voler costruire un evento così infinitamente complicato? Una buona risposta a ciò renderebbe il resto del tuo post più convincente.
whuber

2
Usi pratici: la teoria della probabilità e della misura utilizzata nella matematica della finanza (comprese equazioni differenziali stocastiche, integrali Ito, filtrazioni di algebre, ecc.) Sembra impossibile senza le sigge algebre. (Non posso votare le modifiche perché ho già votato la tua risposta!)
whuber

2

σ

σAB(AB)C

Il primo assioma è che ∅, 𝑋∈𝜎. Bene, sai SEMPRE la probabilità che non accada nulla (0) o che accada qualcosa (1).

Il secondo assioma è chiuso sotto complementi. Lasciami offrire un esempio stupido. Ancora una volta, considera un lancio della moneta, con 𝑋 = {𝐻, 𝑇}. Fai finta di dirti che l'algebra 𝜎 per questo lancio è {∅, 𝑋, {𝐻}}. Cioè, conosco la probabilità che non accada NIENTE, che accada QUALCOSA e di una testa, ma NON conosco la probabilità di una coda. Mi chiameresti giustamente un cretino. Perché se conosci la probabilità di una testa, conosci automaticamente la probabilità di una coda! Se conosci la probabilità che accada qualcosa, conosci la probabilità che NON accada (il complemento)!

L'ultimo assioma è chiuso sotto unioni numerabili. Lascia che ti faccia un altro stupido esempio. Considera il tiro di un dado o 𝑋 = {1,2,3,4,5,6}. E se dovessi dirti l'algebra for per questo è {∅, 𝑋, {1}, {2}}. Cioè, conosco la probabilità di rotolare un 1 o rotolare un 2, ma non conosco la probabilità di rotolare un 1 o un 2. Ancora una volta, mi chiameresti giustamente un idiota (spero che la ragione sia chiara). Cosa succede quando i set non sono disgiunti e cosa succede con innumerevoli unioni è un po 'più disordinato, ma spero che tu possa provare a pensare ad alcuni esempi.

σ

Bene, non è un caso completamente pulito, ma ci sono alcuni solidi motivi per cui .

Perché i probabilisti hanno bisogno di misure?

σσP

Le persone portano il set di Vitali e Banach-Tarski per spiegare perché hai bisogno della teoria delle misure, ma penso che sia fuorviante . Il set di Vitali scompare solo per misure (non banali) invarianti alla traduzione, che gli spazi di probabilità non richiedono. E Banach-Tarski richiede invarianza di rotazione. Le persone di analisi si preoccupano di loro, ma i probabilisti in realtà no .

La ragion d'essere della teoria della misura nella teoria della probabilità è quella di unificare il trattamento dei camper discreti e continui e, inoltre, consentire i camper che sono misti e i camper che semplicemente non sono nessuno dei due.


σσ
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.