TL; DR Non sembra possibile definire una definizione frequentista di probabilità coerente con la struttura di Kolmogorov che non è completamente circolare (nel senso della logica circolare).
Non troppo tempo quindi ho letto: voglio affrontare quelli che vedo come potenziali problemi con la definizione di probabilità frequentista del candidato Primo, può essere ragionevolmente interpretato come una variabile casuale, quindi l'espressione di cui sopra non è definita con precisione in senso rigoroso. Dobbiamo specificare la modalità di convergenza per questa variabile casuale, che sia quasi sicuramente, in probabilità, nella distribuzione, nella media o nel quadrato medio.
limn→∞nAn
nA
Ma tutte queste nozioni di convergenza richiedono che una misura sullo spazio di probabilità sia definita significativa. La scelta intuitiva, ovviamente, sarebbe quella di scegliere la convergenza quasi sicuramente. Questa ha la caratteristica che il limite deve esistere in senso puntuale tranne che per un evento di misura zero. Ciò che costituisce un insieme di misure zero coinciderà per qualsiasi famiglia di misure assolutamente continue l'una rispetto all'altra - questo ci consente di definire una nozione di convergenza quasi sicura che rende rigoroso il limite di cui sopra pur essendo un po 'agnostico su ciò che il sottostante la misura per lo spazio misurabile degli eventi è (cioè perché potrebbe essere qualsiasi misura assolutamente continua rispetto a qualche misura scelta). Ciò impedirebbe la circolarità nella definizione che deriverebbe dalla fissazione anticipata di una determinata misura,
Tuttavia, se stiamo usando una convergenza quasi sicura, ciò significa che ci stiamo limitando alla situazione della legge forte di grandi numeri (d'ora in poi SLLN). Consentitemi di affermare che il teorema (come indicato a p. 133 di Chung) per motivi di riferimento qui:
Sia una sequenza di variabili casuali indipendenti e distribuite in modo identico. Quindi abbiamo dove .E | X 1 | < ∞{Xn}E | X 1 | = ∞
E|X1|<∞⟹Snn→E(X1)a.s.
S n : = X 1 + X 2 + ⋯ + X nE|X1|=∞⟹limsupn→∞|Sn|n=+∞a.s.
Sn:=X1+X2+⋯+Xn
Quindi diciamo che abbiamo uno spazio misurabile e vogliamo definire la probabilità di un evento rispetto ad una famiglia di misure di probabilità reciprocamente assolutamente continue . Quindi con il Teorema di estensione di Kolmogorov o il Teorema di estensione di Tulcea di Ionescu (penso che entrambi funzionino), possiamo costruire una famiglia di spazi di prodotto , uno per ogni . (Si noti che l'esistenza di spazi di prodotto infiniti che è una conclusione del teorema di Kolmogorov richiede che la misura di ogni spazio sia , quindi perché ora sto limitando a misure di probabilità, anziché arbitrarie). Quindi definireA ∈ F { μ i } i ∈ I { ( ∏ ∞ j = 1 X j ) i } i ∈ I μ i 1 1 A j 1 A j(X,F)A∈F{μi}i∈I{(∏∞j=1Xj)i}i∈Iμi11Aj sia la variabile casuale spia, vale a dire che è uguale a se si verifica nel esimo copia e in caso contrario, in altre paroleQuindi chiaramente (dove indica aspettativa rispetto a ), quindi la forte legge di grandi numeri sarà in effetti applica a (perché per costruzione il1Ajn A = 1 A 1 + 1 A 2 + ⋯ + 1 A n . 0 ≤ E i0
nA=1A1+1A2+⋯+1An.
E i μ i ( ∏ ∞ j = 1 X j ) i 1 A j n A0≤Ei1Aj≤1Eiμi(∏∞j=1Xj)i1Ajsono distribuiti in modo identico e indipendente - si noti che essere distribuiti in modo indipendente significa che la misura dello spazio del prodotto è moltiplicativa rispetto alle misure delle coordinate) quindi otteniamo che e quindi la nostra definizione per la probabilità di rispetto a dovrebbe naturalmente essere .
A μ i E 1 1 AnAn→Ei1A1a.s.
AμiE11A
Mi sono appena reso conto tuttavia che anche se la sequenza di variabili casuali converge quasi sicuramente rispetto a se e solo se converge quasi sicuramente rispetto a ( dove ) ciò non significa necessariamente che convergeranno allo stesso valore ; in effetti, la SLLN garantisce che non lo farà a meno che che non è vero genericamente. μi1μi2i1,i2∈IEi11A=Ei21AnAnμi1μi2i1,i2∈IEi11A=Ei21A
Se è in qualche modo "abbastanza canonico", diciamo come la distribuzione uniforme per un set finito, allora forse questo funziona bene, ma in realtà non fornisce nuove intuizioni. In particolare, per la distribuzione uniforme, , cioè la probabilità di è solo la proporzione di punti o eventi elementari in che appartengono ad , che mi sembra di nuovo un po 'circolare. Per una variabile casuale continua non vedo come potremmo mai essere d'accordo su una scelta "canonica" di .μE1A=|A||X|AXAμ
Vale a dire che ha senso definire la frequenza di un evento come probabilità dell'evento, ma non sembra logico definire la probabilità che l'evento sia la frequenza (almeno senza essere circolare). Ciò è particolarmente problematico, poiché nella vita reale non sappiamo in realtà quale sia la probabilità; dobbiamo stimarlo.
Si noti inoltre che questa definizione di frequenza per un sottoinsieme di uno spazio misurabile dipende dal fatto che la misura scelta è uno spazio di probabilità; per esempio, non esiste una misura del prodotto per molte copie di dotate della misura di Lebesgue, poiché . Allo stesso modo, la misura di usando la misura canonica del prodotto è , che esplode all'infinito se o va a zero se , cioè i teoremi di estensione di Kolmogorov e Tulcea sono risultati molto speciali propri delle misure di probabilità . μ ( R ) = ∞ ∏ n j = 1 X ( μ ( X ) ) n μ ( X ) > 1 μ ( X ) < 1Rμ(R)=∞∏nj=1X(μ(X))nμ(X)>1μ(X)<1