Definizione frequentista di probabilità; esiste una definizione formale?


10

Esiste una definizione formale (matematica) di ciò che i frequentatori comprendono sotto "probabilità"? Ho letto che è la frequenza relativa dell'occorrenza '' a lungo termine '', ma esiste un modo formale per definirla? Ci sono riferimenti noti dove posso trovare quella definizione?

MODIFICARE:

Con frequentista (vedi il commento di @whuber e i miei commenti alla risposta @Kodiologist e @Graeme Walsh sotto quella risposta) intendo quelli che "credono" che questa frequenza relativa a lungo termine esiste. Forse questo (in parte) risponde anche alla domanda di @Tim


7
Spiega cosa intendi per "Frequentista". Gli usi che ho visto in altri thread indicano che molte persone non hanno un senso coerente o chiaro di cosa potrebbe significare questo termine. Una definizione contribuirebbe quindi a mantenere pertinenti le risposte.
whuber

5
@whuber Immagino che la definizione di frequentista sia "non bayesiano" e che bayesiano sia "non frequentista" nella maggior parte dei casi :)
Tim


2
Stavo per dire che questo stats.stackexchange.com/a/230943/113090 sarebbe probabilmente di tuo interesse, ma poi ho capito che sei la persona che ha pubblicato quella risposta, quindi non importa. Ad ogni modo, il tuo processo di pensiero potrebbe essere di interesse per gli altri che hanno anche la tua stessa domanda (es. Me) "esiste una definizione formale di probabilità frequentista"
Chill2Macht,

6
Non sono sicuro che avrò l'energia per scrivere una risposta da solo, ma vorrei lasciare qui lo stesso link alla voce Stanford Encyclopedia of Philosophy su Interpretations of Probability che ho pubblicato sotto la tua risposta nel thread correlato. La sezione sull'interpretazione / definizione del frequentista è una buona lettura. Parla ampiamente di vari problemi concettuali con i tentativi di dare una definizione frequente di probabilità.
ameba,

Risposte:


4

TL; DR Non sembra possibile definire una definizione frequentista di probabilità coerente con la struttura di Kolmogorov che non è completamente circolare (nel senso della logica circolare).

Non troppo tempo quindi ho letto: voglio affrontare quelli che vedo come potenziali problemi con la definizione di probabilità frequentista del candidato Primo, può essere ragionevolmente interpretato come una variabile casuale, quindi l'espressione di cui sopra non è definita con precisione in senso rigoroso. Dobbiamo specificare la modalità di convergenza per questa variabile casuale, che sia quasi sicuramente, in probabilità, nella distribuzione, nella media o nel quadrato medio.

limnnAn
nA

Ma tutte queste nozioni di convergenza richiedono che una misura sullo spazio di probabilità sia definita significativa. La scelta intuitiva, ovviamente, sarebbe quella di scegliere la convergenza quasi sicuramente. Questa ha la caratteristica che il limite deve esistere in senso puntuale tranne che per un evento di misura zero. Ciò che costituisce un insieme di misure zero coinciderà per qualsiasi famiglia di misure assolutamente continue l'una rispetto all'altra - questo ci consente di definire una nozione di convergenza quasi sicura che rende rigoroso il limite di cui sopra pur essendo un po 'agnostico su ciò che il sottostante la misura per lo spazio misurabile degli eventi è (cioè perché potrebbe essere qualsiasi misura assolutamente continua rispetto a qualche misura scelta). Ciò impedirebbe la circolarità nella definizione che deriverebbe dalla fissazione anticipata di una determinata misura,

Tuttavia, se stiamo usando una convergenza quasi sicura, ciò significa che ci stiamo limitando alla situazione della legge forte di grandi numeri (d'ora in poi SLLN). Consentitemi di affermare che il teorema (come indicato a p. 133 di Chung) per motivi di riferimento qui:

Sia una sequenza di variabili casuali indipendenti e distribuite in modo identico. Quindi abbiamo dove .E | X 1 | < {Xn}E | X 1 | =

E|X1|<SnnE(X1)a.s.
S n : = X 1 + X 2 + + X n
E|X1|=limsupn|Sn|n=+a.s.
Sn:=X1+X2++Xn

Quindi diciamo che abbiamo uno spazio misurabile e vogliamo definire la probabilità di un evento rispetto ad una famiglia di misure di probabilità reciprocamente assolutamente continue . Quindi con il Teorema di estensione di Kolmogorov o il Teorema di estensione di Tulcea di Ionescu (penso che entrambi funzionino), possiamo costruire una famiglia di spazi di prodotto , uno per ogni . (Si noti che l'esistenza di spazi di prodotto infiniti che è una conclusione del teorema di Kolmogorov richiede che la misura di ogni spazio sia , quindi perché ora sto limitando a misure di probabilità, anziché arbitrarie). Quindi definireA F { μ i } i I { ( j = 1 X j ) i } i I μ i 1 1 A j 1 A j(X,F)AF{μi}iI{(j=1Xj)i}iIμi11Aj sia la variabile casuale spia, vale a dire che è uguale a se si verifica nel esimo copia e in caso contrario, in altre paroleQuindi chiaramente (dove indica aspettativa rispetto a ), quindi la forte legge di grandi numeri sarà in effetti applica a (perché per costruzione il1Ajn A = 1 A 1 + 1 A 2 + + 1 A n . 0 E i0

nA=1A1+1A2++1An.
E i μ i (j = 1 X j ) i 1 A j n A0Ei1Aj1Eiμi(j=1Xj)i1Ajsono distribuiti in modo identico e indipendente - si noti che essere distribuiti in modo indipendente significa che la misura dello spazio del prodotto è moltiplicativa rispetto alle misure delle coordinate) quindi otteniamo che e quindi la nostra definizione per la probabilità di rispetto a dovrebbe naturalmente essere .A μ i E 1 1 A
nAnEi1A1a.s.
AμiE11A

Mi sono appena reso conto tuttavia che anche se la sequenza di variabili casuali converge quasi sicuramente rispetto a se e solo se converge quasi sicuramente rispetto a ( dove ) ciò non significa necessariamente che convergeranno allo stesso valore ; in effetti, la SLLN garantisce che non lo farà a meno che che non è vero genericamente. μi1μi2i1,i2IEi11A=Ei21AnAnμi1μi2i1,i2IEi11A=Ei21A

Se è in qualche modo "abbastanza canonico", diciamo come la distribuzione uniforme per un set finito, allora forse questo funziona bene, ma in realtà non fornisce nuove intuizioni. In particolare, per la distribuzione uniforme, , cioè la probabilità di è solo la proporzione di punti o eventi elementari in che appartengono ad , che mi sembra di nuovo un po 'circolare. Per una variabile casuale continua non vedo come potremmo mai essere d'accordo su una scelta "canonica" di .μE1A=|A||X|AXAμ

Vale a dire che ha senso definire la frequenza di un evento come probabilità dell'evento, ma non sembra logico definire la probabilità che l'evento sia la frequenza (almeno senza essere circolare). Ciò è particolarmente problematico, poiché nella vita reale non sappiamo in realtà quale sia la probabilità; dobbiamo stimarlo.

Si noti inoltre che questa definizione di frequenza per un sottoinsieme di uno spazio misurabile dipende dal fatto che la misura scelta è uno spazio di probabilità; per esempio, non esiste una misura del prodotto per molte copie di dotate della misura di Lebesgue, poiché . Allo stesso modo, la misura di usando la misura canonica del prodotto è , che esplode all'infinito se o va a zero se , cioè i teoremi di estensione di Kolmogorov e Tulcea sono risultati molto speciali propri delle misure di probabilità . μ ( R ) = n j = 1 X ( μ ( X ) ) n μ ( X ) > 1 μ ( X ) < 1Rμ(R)=j=1nX(μ(X))nμ(X)>1μ(X)<1


1
Grazie per la bella risposta (+1). Concordo sul fatto che ci siano "problemi" con la definizione in termini di frequenza relativa di lungo periodo, questo è stato probabilmente uno dei motivi per cui Kolmogorov ha sviluppato il suo Grundbegriffe. Tuttavia, quando parliamo di frequentatori, dobbiamo inserirci nel lasso di tempo prima della teoria di Kolmogorov, penso?

2
@fcop Suppongo che onestamente non ne abbia idea. Immagino che ciò che sto cercando di dire sia che non vedo come qualsiasi giustificazione rigorosa per la comprensione frequente della probabilità possa portare a una definizione utile / non circolare.
Chill2Macht,

@fcop Apprezzo molto la generosa generosità - oggi ero davvero di cattivo umore prima di riceverlo. Onestamente mi ha un po 'pavimentato (in senso buono). Ancora una volta, lo apprezzo molto
Chill2Macht

non menzionarlo, la tua risposta è molto ben sviluppata e matematicamente valida.

6

Non penso che ci sia una definizione matematica, no. La differenza tra le varie interpretazioni della probabilità non è una differenza nel modo in cui la probabilità è definita matematicamente. La probabilità potrebbe essere definita matematicamente in questo modo: se è uno spazio di misura con , allora la probabilità di qualsiasi evento è solo . Spero che tu sia d'accordo sul fatto che questa definizione sia neutrale rispetto a domande come se dovremmo interpretare le probabilità in modo frequentista o bayesiano.μ ( Ω ) = 1 S Σ μ ( S )(Ω,Σ,μ)μ(Ω)=1SΣμ(S)


va bene ma questa definizione di probabilità come che soddisfa gli assiomi di Kolmogorov è molto astratta, deve essere definita in casi specifici. È uguale a "un cerchio è l'insieme di punti che si trova a una determinata distanza da un punto fisso". Non significa nulla fintanto che non dici in quale spazio metrico sei: dovresti dire qual è la definizione di "distanza". Penso che definire come frequenza relativa a lungo termine soddisfi gli assiomi di Kolmogorov, cosa ne pensi? PS La defintizione nel commento di @Silverfish soddisfa anche questi assiomi. PμP

(continua) quindi, in breve, posso definire ( definire è la parola giusta), molti che soddisfano gli assiomi di Kolmogorov e queste sono tutte valide probabilità secondo la teoria assiomatica. μ

Probabilmente, il sistema di Kolmogorov fornisce una base assiomatica - che non implica necessariamente un'interpretazione frequentista o bayesiana. Nello spirito della visione frequentista, l'idea di base è che quando il numero di prove aumenta all'infinito, la frequenza empirica si stabilizza attorno o converge verso un certo valore; la probabilità dell'evento. Sebbene l'approccio in frequenza migliora l'approccio classico, la mancanza di rigore porta alla fondazione assiomatica. È più una domanda sulla storia della teoria della probabilità?
limn(nA/n)=PA=P(A).
Graeme Walsh,

@Graeme Walsh: potresti metterlo in una risposta e completarlo con argomenti perché una tale definizione di è in linea con gli assiomi di Kolmogorov? (ovviamente si può mettere in dubbio l'esistenza del limite, ma allora potremmo dire che i frequentatori sono quelli che "credono" nell'esistenza di esso?)P(A)

2
@fcop Come osserva Walsh, questa "definizione" non è rigorosa.
Kodiologo,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.