Come dovrei affrontare mentalmente il paradosso di Borel?


17

Mi sento un po 'a disagio per come ho affrontato mentalmente il paradosso di Borel e altri "paradossi" associati che hanno a che fare con la probabilità condizionale. Per coloro che stanno leggendo questo e non lo conoscono, vedere questo link . La mia risposta mentale fino a questo punto è stata per lo più ignorarla perché nessuno sembra parlarne, ma sento che dovrei correggerlo.

Sappiamo che questo paradosso esiste, eppure sembra che in pratica (come esempio estremo, analisi bayesiana) stiamo perfettamente bene con il condizionamento su eventi di misura ; se X sono i miei dati, condizioniamo sempre X = x , anche se questo è un evento di misura 0 quando X è continuo. E certamente non facciamo alcuno sforzo per costruire una sequenza di eventi convergenti con l'evento che abbiamo osservato per risolvere il paradosso, almeno non esplicitamente.0XX=x0X

Penso che vada bene perché abbiamo essenzialmente risolto la variabile casuale (in linea di principio) prima dell'esperimento, e quindi stiamo condizionando su σ ( X ) . Cioè, σ ( X ) è l' algebra σ naturale da condizionare perché l'informazione X = x verrà utilizzata attraverso X - se fosse venuta da noi in qualche altro modo, ci saremmo condizionati su una diversa σ -algebra. Il paradosso di Borel sorge perché (immagino) non è ovvio quale sia l' algebra σ appropriata su cui condizionare, ma il bayesiano ha specificatoXσ(X)σ(X)σX=xXσσ . Perché stiamo specificando a priori che l'informazione X = x ci è arrivata permezzo della misurazione di X siamo in chiaro. Una volta specificato l'algebra σ , tutto va bene; costruiamo la nostra aspettativa condizionale usando Radon-Nikodym e tutto è unico fino a null set.σ(X)X=xXσ

È sostanzialmente giusto o sto andando via? Se sono lontana, qual è la giustificazione per comportarci come facciamo? [Data la natura di domande e risposte di questo sito, considera questa come una mia domanda.] Quando ho preso la mia probabilità teorica di misura, per qualche ragione non capisco, non abbiamo mai nemmeno toccato le aspettative condizionali. Di conseguenza, sono preoccupato che le mie idee siano molto confuse.


2
Quando ho preso la mia probabilità teorica di misura, per qualche ragione non capisco, non abbiamo nemmeno toccato l'aspettativa condizionale. Whoa. Sono interessato a questo piccolo frammento. Che testo hai usato? Come hai seguito un corso con un nome del genere e non hai mai visto le martingala, le catene di Markov o una serie di altri argomenti "standard"?
cardinale il

1
Penso che il "quadro generale" dietro questa risposta fornisca almeno una risposta parziale alle domande attuali. :)
cardinale

1
@cardinal Non abbiamo usato un libro di testo, abbiamo usato le note degli istruttori. L'istruttore ha trascorso tutta la sua carriera di ricercatore a dimostrare leggi di grandi numeri per lo spazio di Banach valutando elementi casuali e apparentemente non aveva bisogno di tali cose. Di conseguenza, non ha insegnato loro. Abbiamo imparato gli argomenti che ha ritenuto importanti per il suo lavoro. L'altro professore che ha insegnato probabilità ha usato Billingsley e non era miope. Ho raccolto ciò che so leggendo Billingsley ai miei tempi.
ragazzo

4
Grazie per avermi concesso e (+1) alla tua domanda. A proposito, Billingsley è un meraviglioso testo di riferimento, ma deve essere stato un po 'frustrante come test di classe e scelta di studio autonomo, se non altro per l'organizzazione. Potresti essere interessato a Probabilità di D. Williams con Martingales se vuoi un compagno breve che pone un'enfasi decisamente grande sull'aspettativa condizionale. Saluti. :-)
cardinale

Risposte:


8

Come bayesiano, direi che il paradosso di Borel non ha nulla (o molto poco) a che fare con le statistiche bayesiane. Ad eccezione del fatto che le statistiche bayesiane usano distribuzioni condizionate, ovviamente. Il fatto che non vi sia alcun paradosso nel definire una distribuzione posteriore come condizionale su un insieme di misura zero è che x non è scelto in anticipo, ma come risultato dell'osservazione. Pertanto, se vogliamo utilizzare definizioni esotiche per le distribuzioni condizionali su insiemi di misure zero, non vi è alcuna possibilità che tali insiemi conterranno la x{X=x}xxche osserveremo alla fine. La distribuzione condizionale è definita in modo univoco quasi ovunque e quindi quasi sicuramente scrive la nostra osservazione. Questo è anche il significato della (grande) citazione di A. Kolmogorov nella voce di Wikipedia.

Un punto dell'analisi bayesiana in cui le sottigliezze teoriche della misura possono trasformarsi in un paradosso è la rappresentazione Savage-Dickey del fattore Bayes, poiché dipende da una versione specifica della densità precedente (come discusso nel nostro articolo sull'argomento ...)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.