La teoria della probabilità è lo studio di funzioni non negative che si integrano / sommano a una?


26

Questa è probabilmente una domanda sciocca, ma la teoria della probabilità è lo studio di funzioni che si integrano / sommano a una?

MODIFICARE. Ho dimenticato la non negatività. Quindi la teoria della probabilità è lo studio di funzioni non negative che si integrano / sommano a una?


Sì, le probabilità si sommano sempre a una. Le probabilità invece non hanno questo vincolo.
Mike Hunter,

2
L'unica risposta ragionevole alla domanda, come affermato, è no, non da ultimo perché ci sono molte funzioni che si integrano in 1 ma per le quali non può rappresentare le probabilità per alcuni e . Ad esempio, considera una funzione compresa tra 1,5 e 0 e -0,5 tra 1 e 2 e 0 ovunque. (ma è anche probabilmente "no" anche per altri motivi)fabf(u)duab
Glen_b -Reinstate Monica


1
Esistono seri documenti sulla probabilità negativa, ad esempio Maurice S. Bartlett. doi.org/10.1017/S0305004100022398
Nick Cox

2
@dontloo quello a cui stavo puntando ora è abbastanza ben coperto dalla citazione del Tao nella risposta di Chaconne.
Glen_b

Risposte:


31

A un livello puramente formale, si potrebbe chiamare la teoria della probabilità lo studio degli spazi di misura con la misura totale uno, ma sarebbe come chiamare la teoria dei numeri lo studio delle stringhe di cifre che terminano

- dagli argomenti di Terry Tao nella teoria delle matrici casuali .

Penso che questa sia la cosa davvero fondamentale. Se abbiamo uno spazio di probabilità e una variabile casuale con la misura pushforward , allora il motivo una densità integra con uno perché . E questo è più fondamentale di pdfs vs pmfs.X : Ω R P X : = P X - 1 f = d P X(Ω,F,P)X:ΩRPX:=PX1 P(Ω)=1f=dPXdμP(Ω)=1

Ecco la prova:

Rfdμ=RdPX=PX(R)=P({ωΩ:X(ω)R})=P(Ω)=1.

Questo è quasi una riformulazione della risposta di AdamO (+1) perché tutti i CDF sono càdlàg, e c'è una relazione uno a uno tra l'insieme dei CDF su e l'insieme di tutte le misure di probabilità su , ma poiché il CDF di un camper è definito in termini di distribuzione, considero gli spazi di probabilità come il luogo in cui "iniziare" con questo tipo di sforzo. ( R , B )R(R,B)


Sto aggiornando per approfondire la corrispondenza tra CDF e misure di probabilità e come entrambe sono risposte ragionevoli per questa domanda.

Iniziamo con due misure di probabilità e analizzando i CDF corrispondenti. Concludiamo invece iniziando con un CDF e osservando la misura da esso indotta.

Sia e misure di probabilità su e e siano i rispettivi CDF (ovvero e similmente per ) e rappresenterebbero entrambi due misure pushforward di variabili casuali (cioè distribuzioni), ma in realtà non importa da dove provengano.R ( R , B ) F Q F R F Q ( a ) = Q ( ( - , a ] ) R Q RQR(R,B)FQFRFQ(a)=Q((,a])RQR

L'idea chiave è questa: se e concordano su una raccolta abbastanza ricca di insiemi, allora concordano generata da quegli insiemi. Intuitivamente, se abbiamo una raccolta ben educata di eventi che, attraverso un numero numerabile di complementi, intersezioni e sindacati formano tutti , allora concordare su tutti questi set non lascia spazio a discordare su qualsiasi Borel impostato.R σ BQRσB

Formalizziamolo. Let e let , cioè è il sottoinsieme di su cui e concordano (e sono definiti). Nota che stiamo permettendo loro di accordarsi su insiemi non di Borel poiché come definito isn 't necessariamente un sottoinsieme di . Il nostro obiettivo è quello di dimostrare che .L = { A R : Q ( A ) = R ( A ) } L P ( R ) Q R L B BLS={(,a]:aR}L={AR:Q(A)=R(A)}LP(R)QRLBBL

Si scopre che (la -algebra generata da ) è in realtà , quindi speriamo che sia una raccolta sufficientemente grande di eventi che se ovunque su allora sono costretti a essere uguale su tutti .σ S B S Q = R S Bσ(S)σSBSQ=RSB

Si noti che è chiuso sotto intersezioni finite e che è chiuso sotto complementi e intersezioni disgiunte numerabili (questo segue da -additivity). Ciò significa che è un -system e è un -system . Con il - teorema abbiamo quindi che . Gli elementi diL σ S π L λ π λ σ ( S ) = BL S S Q R S B BSLσSπLλπλσ(S)=BLSnon sono affatto complessi come un insieme di Borel arbitrario, ma poiché qualsiasi insieme di Borel può essere formato da un numero numerabile di complementi, unioni e intersezioni di elementi di , se non c'è un singolo disaccordo tra e su elementi di allora questo sarà seguito attraverso non essendovi disaccordo su qualsiasi .SQRSBB

Abbiamo appena dimostrato che se allora (su ), ciò significa che la mappa da a è un'iniezione.FQ=FRQ=RBQFQP:={P:P is a probability measure on (R,B)}F:={F:RR:F is a CDF}

Ora, se vogliamo pensare di andare nella direzione opposta, vogliamo iniziare con un CDF e mostrare che esiste una misura di probabilità unica tale che . in questo modo stabilire che la nostra mappatura è in realtà una corrispondenza biunivoca. per questa direzione, definiamo , senza alcun riferimento alla probabilità o misure.FQF(a)=Q((,a])QFQF

Definiamo innanzitutto una funzione di misura Stieltjes come una funzione tale cheG:RR

  1. G è non decrescente
  2. G è continuo a destra

(e nota come l'essere càdlàg deriva da questa definizione, ma a causa del vincolo non decrescente aggiuntivo "la maggior parte" delle funzioni di càdlàg non sono funzioni di misura di Stieltjes).

Si può dimostrare che ogni funzione Stieltjes induce una misura unica su definita da (vedi ad esempio Probabilità di Durrett e Processi casuali per dettagli su questo.) Ad esempio, la misura di Lebesgue è indotta da .μ ( R , B ) μ ( ( a , b ] ) = G ( b ) - G ( a ) G ( x ) = xGμ(R,B)

μ((a,b])=G(b)G(a)
G(x)=x

Ora notando che un CDF è una funzione Stieltjes con le proprietà aggiuntive che e , possiamo applicare quel risultato per mostrare che per ogni CDF otteniamo una misura unica su definita da limFlimxF(x):=F()=0limxF(x):=F()=1FQ(R,B)

Q((a,b])=F(b)F(a).

Nota come e quindi è una misura di probabilità ed è esattamente quella che avremmo usato per definire se stessimo andando nella direzione opposta.Q((,a])=F(a)F()=F(a)Q((,])=F()F()=1QF

Tutti insieme ora abbiamo visto che la mappatura è 1-1 e sul modo che hanno davvero una corrispondenza biunivoca tra e . Riportando questo alla domanda reale, questo dimostra che potremmo sostenere in modo equivalente CDF o misure di probabilità come il nostro oggetto di cui dichiariamo la probabilità di essere lo studio (pur riconoscendo che si tratta di uno sforzo un po 'facetious). Personalmente preferisco ancora spazi di probabilità perché sento che la teoria scorre più naturalmente in quella direzione, ma i CDF non sono "sbagliati".QFQPF


3
+1 per una prospettiva più ampia in materia; Notate correttamente che lo spazio-funzione càdlàg di Skorokhod è solo una nozione attuale di ciò che la teoria della probabilità comporta, radicalmente diversa da quella di Borel, e le scoperte di Skorokhod risalgono a circa 40 anni circa. Chissà cosa potrebbe scoprire il prossimo secolo?
AdamO

1
@AdamO assolutamente, e ci sono quelli più strani come la probabilità non archivistica, dove anche se non diventano mai la visione dominante (e per quanto ne sappia nessuno sta seriamente cercando di farlo) trovo che mi aiutino a capire meglio la formulazione standard ( ad es. quanto sia grave la
dipendenza

Ho letto il titolo della domanda e ho pensato a quella citazione di Terence Tao; devo averlo letto anni fa ( 2010 ) ma è davvero memorabile. Come continua dicendo, a livello pratico, è vero il contrario ...
ShreevatsaR

Vedi il mio commento sulla domanda: in che modo le teorie alternative della probabilità, come Bayesian (e Dempster-Shafer e il modello di credibilità trasferibile e la teoria di Dezert-Smarandache), probabilità imprecise, teoria della plausibilità, ecc. Si collegano a questa domanda e discussione?
E. Douglas Jensen,

@ E.DouglasJensen Non sono sicuro, lo sto affrontando in termini di assiomi Kolmogorov standard, quindi in quel contesto penso che la mia risposta sia "giusta", ma se cambiamo gli assiomi suppongo che tutte le scommesse siano disattivate . Inoltre non sono affatto filosofico, quindi se stiamo cercando di collegarlo al mondo reale in qualche modo, ad esempio con domande come "qual è la probabilità che il sole sorge", allora sono sicuro che ottenga più complicato. Tuttavia, sembra una scommessa abbastanza sicura che la probabilità che "qualsiasi cosa" accada è il valore massimo (probabilmente ) e che non vi è alcuna incertezza in ciò1
jld

12

No; la distribuzione Cantor è proprio un controesempio. È una variabile casuale, ma non ha densità. Ha una funzione di distribuzione, tuttavia. Direi, quindi, che la teoria della probabilità è lo studio delle funzioni di càdlàg , compreso il Cantor DF, che ha lasciato i limiti di 0 e i limiti di destra di 1.


Bello, non ho mai sentito parlare delle funzioni del cadlag. Tuttavia, questi assumono ancora uno spazio reale e uno metrico. Non tutta la teoria della probabilità viene fatta su tali spazi.
HRSE

1
Ad esempio, puoi tornare a Terrence Fine, Theories of Probability. Nota anche che le funzioni cadlag (almeno secondo l'articolo di Wikipedia) hanno i numeri reali come dominio. "Foundations of Statistics" di LJ Savage fornisce un resoconto della teoria della probabilità (soggettiva) su spazi che non sono necessariamente reali.
HRSE

1
@jwg Alcuni altri commenti in questo post riguardano la probabilità negativa, che sembra essere di qualche utilità nella fisica quantistica sebbene la mia mente semplice non riesca a capire una cosa del genere.
AdamO

1
@HRSE grazie per i riferimenti. Non sono riuscito a trovarne nessuno online, ma ho sfogliato altri articoli di quegli autori, anche se non ho trovato alcun esempio di questo. Se stiamo definendo una variabile casuale come il CDF viene definito in termini della misura pushforward (non la misura su ) e poiché un valore reale è necessariamente una misura su che significa che possiamo alimentare insiemi come così ha come dominio. Mi manca qualcosa?XX:ΩRnPX:=PX1P(Ω,F)XPX(Rn,Bn)(,a]FRn
giovedì

1
Penso che ben ordinato significhi che ogni sottoinsieme ha un minimo elemento mentre totalmente ordinato significa per tutti e , esattamente uno di , o vale, quindi è entrambi, è solo totalmente ordinato e non è nessuno dei due. Dobbiamo assolutamente moltiplicare e aggiungere le probabilità, quindi almeno il codice di dovrebbe essere un campo, ma non credo che debba essere totalmente ordinato o completo. Misure di valore complesso sono un esempio della prima e misure di valore iperreale sono un esempio della seconda. Tutti questi sono spazi metrici però (o possono essere)xyx<yx>yx=yNRCP
jld

6

Sono sicuro che otterrai buone risposte, ma ti darò una prospettiva leggermente diversa qui.

Potresti aver sentito i matematici dire che la fisica è praticamente matematica, o solo un'applicazione della matematica alle leggi più elementari della natura. Alcuni matematici (molti?) Credono davvero che sia così. L'ho sentito più volte all'università. A questo proposito stai ponendo una domanda simile, anche se non così ampia come questa.

Il fisico di solito non si preoccupa nemmeno di rispondere a questa affermazione: è troppo ovvio per loro che non è vero. Tuttavia, se provi a rispondere, diventa chiaro che la risposta non è così banale, se vuoi renderla convincente.

La mia risposta è che la fisica non è solo un mucchio di modelli, equazioni e teorie. È un campo con una propria serie di approcci, strumenti, euristica e modi di pensare. Questo è uno dei motivi per cui, sebbene Poincarese abbia sviluppato la teoria della relatività prima di Einstein, non si è reso conto di tutte le implicazioni e non ha perseguito tutti i problemi. Einstein l'ha fatto, perché era un fisico e ha capito subito cosa significasse. Non sono un fan del ragazzo, ma il suo lavoro sul moto browniano è un altro esempio di come un fisico costruisce un modello matematico. Quel documento è sorprendente, ed è pieno di intuizione e tracce di pensiero che sono inequivocabilmente occhi della fisica.

Quindi, la mia risposta è che anche se la probabilità avesse a che fare con il tipo di funzioni che hai descritto, non sarebbe comunque stato lo studio di quelle funzioni. Né è una teoria delle misure applicata ad alcune sottoclassi di misure. La teoria della probabilità è il campo distinto che studia le probabilità, è collegata a un mondo naturale attraverso il decadimento radioattivo e la meccanica quantistica e i gas, ecc. Se accade in modo che alcune funzioni sembrino adatte a modellare le probabilità, allora le useremo e studieremo le loro anche proprietà, ma mentre lo facciamo, terremo d'occhio il premio principale: le probabilità.


1
+1 per aver portato la realtà in una lotta di matematica e aver effettivamente risposto alla domanda con l'unica risposta ragionevole, vale a dire che qualsiasi riduzionismo del genere non ha senso
jld

@Chaconne Ho imparato oggi una parola utile riduzionismo , la incorporerò nel mio vocabolario :)
Aksakal

+1, questo è quello che stavo cercando di dire con la mia risposta, ma l'ho detto in modo meno efficace di quanto pensi.
Nathaniel

4

Bene, parzialmente vero, manca una seconda condizione. Le probabilità negative non hanno senso. Pertanto, queste funzioni devono soddisfare due condizioni:

  • Distribuzioni continue:

    Df(x)dx=1andf(x)>0xD
  • Distribuzioni discrete:

    xDP(x)=1and0<P(x)1xD

Dove è il dominio in cui è definita la distribuzione di probabilità.D


Grazie mille Carlos per la risposta, in realtà voglio sapere se fosse stata aggiunta la condizione non negativa?
dontloo,

1
Direi che ridurre il campo di probabilità per studiare le funzioni di densità / massa di probabilità (soddisfacendo le proprietà superiori) è troppo spoglio. Inoltre, come è stato affermato da @AdamO, ci sono alcuni casi di variabili casuali che non hanno la funzione di densità di probabilità, anche se hanno un cdf ben definito.
Carlos Campos,

@CarlosCampos: Per quanto riguarda le probabilità negative: in realtà hanno senso in alcuni contesti, ad esempio le mezze monete. Vedi en.wikipedia.org/wiki/Negative_probability per qualche informazione in più.
Inkane,

3

Direi di no, non è questa la teoria della probabilità fondamentalmente, ma la direi per ragioni diverse rispetto alle altre risposte.

Fondamentalmente, direi, la teoria della probabilità è lo studio di due cose:

  1. Processi stocastici e

  2. Inferenza bayesiana.

I processi stocastici includono cose come lanciare dadi, tirare palle da urne, ecc., Nonché i modelli più sofisticati trovati in fisica e matematica. L'inferenza bayesiana è un ragionamento sotto incertezza, usando le probabilità per rappresentare il valore di quantità sconosciute.

Queste due cose sono più strettamente correlate di quanto potrebbero apparire a prima vista. Uno dei motivi per cui possiamo studiarli sotto lo stesso ombrello è che aspetti importanti di entrambi possono essere rappresentati come funzioni non negative che si sommano / si integrano in uno. Ma la probabilità non è solo lo studio di quelle funzioni, ma anche la loro interpretazione in termini di processi casuali e inferenza ne è una parte importante.

Ad esempio, la teoria della probabilità include concetti come probabilità condizionali e variabili casuali e quantità come l'entropia, l'informazione reciproca e l'aspettativa e la varianza delle variabili casuali. Mentre uno potrebbe definire queste cose puramente in termini di funzioni non negative normalizzate, la motivazione per questo sembrerebbe piuttosto strana senza l'interpretazione in termini di processi casuali e inferenza.

Inoltre, a volte si incontrano concetti nella teoria della probabilità, in particolare dal lato dell'inferenza, che non possono essere espressi in termini di una funzione non negativa che si normalizza a uno. I cosiddetti "priori impropri" vengono in mente qui, e AdamO ha dato alla distribuzione Cantor come un altro esempio.

Vi sono certamente alcune aree della teoria della probabilità in cui l'interesse principale è nelle proprietà matematiche delle funzioni non negative normalizzate, per le quali i due domini applicativi che ho citato non sono importanti. In questo caso, spesso la chiamiamo teoria della misura piuttosto che teoria della probabilità. Ma la teoria della probabilità è anche - anzi, direi per lo più - un campo applicato e le applicazioni delle distribuzioni di probabilità sono di per sé una componente non banale del campo.


2
Hai ristretto il dominio degli argomenti della teoria della probabilità ...
Tim

@Tim non di proposito - l'ho diviso in due aree, ma volevo che ognuna di esse fosse interpretata in modo molto ampio. Potete darmi alcuni altri argomenti che non rientrano in nessuna delle due intestazioni?
Nathaniel
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.