Cosa c'è di così fico nel teorema della rappresentazione di De Finetti?


55

Da Theory of Statistics di Mark J. Schervish (pagina 12):

Sebbene il teorema di rappresentazione di DeFinetti 1.49 sia fondamentale per motivare modelli parametrici, in realtà non viene utilizzato nella loro implementazione.

In che modo il teorema è centrale nei modelli parametrici?


2
Penso che sia fondamentale per i modelli bayesiani. Ne stavo solo discutendo con singleton. La sua importanza nelle statistiche bayesiane viene trascurata se non da quei bayesiani che erano seguaci di deFinetti. Vedi questo riferimento di Diaconis e Freedman del 1980
Michael Chernick,

1
@cardinal: pagina 12 (ho aggiornato la domanda).
gui11aume,

2
Nota che Schervish ha detto "... centrale per motivating modelli parametrici ...".
Zen,

1
Mi sono spesso chiesto quanto della rappresentazione sia "reale" e quanto si basi su particolari interpretazioni del teorema. Può essere usato altrettanto facilmente per descrivere una distribuzione precedente come per descrivere un modello.
Probislogic,

Risposte:


79

Il Teorema della Rappresentazione di De Finetti fornisce in un'unica interpretazione, nell'ambito dell'interpretazione soggettivistica delle probabilità, la ragion d'essere dei modelli statistici e il significato dei parametri e delle loro precedenti distribuzioni.

Supponiamo che le variabili casuali rappresentino i risultati di lanci successivi di una moneta, con i valori 1 e 0 corrispondenti ai risultati "Testa" e "Code", rispettivamente. Analizzando, nel contesto di un'interpretazione soggettivistica del calcolo della probabilità, il significato del solito modello frequentista secondo il quale gli X i sono indipendenti e identicamente distribuiti, De Finetti ha osservato che la condizione di indipendenza implicherebbe, ad esempio, che P { X n = x nX 1 = x 1X1,,Xn10Xi E, di conseguenza, i risultati del primo n - 1 lanci sarebbero non cambiare la mia incertezza circa il risultato di n -esimo lancio. Ad esempio, se credo a priori che si tratta di una moneta bilanciata, quindi, dopo aver ottenuto le informazioni che i primi 999 lanci si sono rivelati "teste", continuerei a credere, condizionatamente a tali informazioni, che la probabilità di ottenere " teste" a lancio 1000 è pari a 1 / 2 . In effetti, l'ipotesi di indipendenza della X i 's implicherebbe che è impossibile conoscere nulla circa la moneta osservando i risultati delle sue lanci.

P{Xn=xnX1=x1,,Xn1=xn1}=P{Xn=xn},
n1na priori9991/2Xi

Questa osservazione ha portato De Finetti all'introduzione di una condizione più debole dell'indipendenza che risolve questa apparente contraddizione. La chiave della soluzione di De Finetti è una sorta di simmetria distributiva nota come scambiabilità.

Per un dato insieme finito { X i } n i = 1 di oggetti casuali, lasciate μ X 1 , ... , X n denotare la loro distribuzione congiunta. Questo set finito è scambiabile se μ X 1 , ... , X n = μ X π ( 1 ) , ... , X π ( n ) , per ogni permutazione π : { 1 , ...Definition.{Xi}i=1nμX1,,XnμX1,,Xn=μXπ(1),,Xπ(n) . Una sequenza { X i } i = 1 di oggetti casuali è scambiabile se ciascuno dei suoi sottoinsiemi finiti è scambiabile.π:{1,,n}{1,,n}{Xi}i=1

{Xi}i=1Xi01{Xi}i=1Θ:Ω[0,1]μΘ

P{X1=x1,,Xn=xn}=[0,1]θs(1θ)nsdμΘ(θ),
s=i=1nxi
X¯n=1ni=1nXinΘalmost surely,

{Xi}i=1there isparameter ΘΘconditionallyΘμΘX¯nXiΘ

P{Xn=1X1=x1,,Xn1=xn1}=E[ΘX1=x1,,Xn1=xn1].

2
Grazie per questa risposta perspicace! Il tuo punto sull'indipendenza è molto importante che realizzo per la prima volta.
gui11aume,

("un utile" era meglio :))
Neil G

1
ΘΘXiE[θs(1θ)s]=E[P(Xi=xii|θ)]θ

n i = 1 Pr { X i = x iΘ = θ } = n i = 1 θ x i ( 1 - θ ) 1 - x i X i Θ = θPr{X1=x1,,Xn=xnΘ=θ}i=1nPr{Xi=xiΘ=θ}=i=1nθxi(1θ)1xiXiΘ=θ

@Zen Grazie! Capisco la prima frase, tuttavia la parte "poiché si considera "non mi è ancora chiaro. Come fai a sapere che fattori in questo modo? Sembra che stai abbandonando il valore atteso dall'identità che ho scritto nel mio commento precedente, ma non sono sicuro di come sia giustificato. i=1nPr{Xi=xiΘ=θ}=i=1nθxi(1θ)1xi
user795305,

17

Tutto è matematicamente corretto nella risposta dello Zen. Tuttavia non sono d'accordo su alcuni punti. Si prega di essere consapevoli del fatto che non pretendo / credo che il mio punto di vista sia quello buono; al contrario, ritengo che questi punti non siano ancora del tutto chiari per me. Queste sono domande alquanto filosofiche di cui mi piace discutere (e un buon esercizio di inglese per me), e sono anche interessato a qualsiasi consiglio.

  • Sull'esempio con "Heads", il commento Zen: "l'ipotesi di indipendenza degli implicherebbe l'impossibilità di imparare qualcosa sulla moneta osservando i risultati dei suoi lanci". Questo non è vero dal punto di vista del frequentatore: apprendere la moneta significa apprendere su , che è possibile stimando (punto-stima o intervallo di confidenza) dai precedenti risultati . Se il frequentatore osserva "Heads", conclude che è probabilmente vicino a , e quindi anche conseguenza.999Xiθθ999999θ1Pr(Xn=1)

  • A proposito, in questo esempio di lancio delle monete, qual è il casuale ? Immaginando che ciascuna delle due persone giochi a un lancio di monete un numero infinito di volte con la stessa medaglia, perché dovrebbero trovare un diverso ? Ho in mente che la caratteristica del lancio della moneta è il fisso che è il valore comune di per qualsiasi giocatore ("quasi ogni giocatore" per motivi matematici tecnici). Un esempio più concreto per il quale non esiste un interpretabile random è il caso di un campionamento casuale con sostituzione in una popolazione finita di e .Θθ=X¯θX¯Θ01

  • A proposito del libro di Schervish e della domanda sollevata dall'OP, penso che (in breve tempo) Schervish significhi che la scambiabilità è un presupposto "cool" e quindi il teorema di deFinetti è "cool" perché afferma che ogni modello intercambiabile ha una rappresentazione parametrica. Ovviamente sono totalmente d'accordo. Tuttavia, se presumo un modello intercambiabile come e allora sarebbe interessato nell'eseguire inferenza circa e , non alla realizzazione di . Se sono interessato solo alla realizzazione di allora non vedo alcun interesse nell'ipotizzare scambiabilità.Θ Beta ( a , b ) a b Θ Θ(XiΘ=θ)iidBernoulli(θ)ΘBeta(a,b)abΘΘ

È tardi...


4
Ciao Stéphane! Grazie per i tuoi commenti sulla mia risposta. A proposito del tuo primo punto che , nella mia risposta tutto è dichiarato in un contesto bayesiano. Non esiste un vero tentativo di stabilire un contrasto con altri paradigmi di inferenza. In breve, ho cercato di esprimere ciò che il teorema di De Finetti significa per me, come bayesiano. "this is not true from the frequentist perspective"
Zen,

4
A proposito del tuo secondo proiettile: il casuale è (come) il limite di , come indicato nella LLN di De Finetti. Quindi, quando alcuni bayesiani affermano che il mio precedente per è , significa che questa distribuzione rappresenta la sua incertezza su questo limite, prima di avere accesso ai dati. Bayesiani diversi possono avere diversi priori, ma, con adeguate condizioni di regolarità, avranno accordo su (posizioni simili), poiché ottengono sempre più informazioni sui risultati dei lanci. ˉ X n Θ μ Θ a posteriori ΘΘX¯nΘμΘa posterioriΘ
Zen,

Il fisso ma sconosciuto non è un concetto bayesiano. θ
Zen,

1
A proposito del tuo terzo proiettile, dato: 1) Che Schervish è uno statistico bayesiano; 2) La quantità di tempo e di energia che trascorre discutendo della scambiabilità nel suo libro; Credo che per lui il ruolo del teorema di De Finetti sia molto profondo, andando ben oltre la freddezza. Ma sono d'accordo che è molto bello, comunque!
Zen,

2
Per chiarire il mio punto di vista: non credo che ci sia un casuale in un modello bayesiano "di base" (non gerarchico). Esiste un sconosciuto fisso e la distribuzione precedente ne descrive la convinzione. Il ruolo della variabile casuale è solo il trattamento matematico dell'inferenza bayesiana, non ha alcuna interpretazione nell'esperimento. Se si assume davvero osservazioni intercambiabili ma non indipendenti, come l'esempio del mio terzo punto, allora bisogna mettere hyperpriors su e . θ Θ a bθθΘab
Stéphane Laurent,

11

Potreste essere interessati a un articolo su questo argomento (è richiesto l'abbonamento al diario per l'accesso - provate ad accedervi dalla vostra università):

O'Neill, B. (2011) Scambiabilità, correlazione ed effetto di Bayes. Revisione statistica internazionale 77 (2), pagg. 241-250.

Questo documento discute il teorema della rappresentazione come base per entrambi i modelli IID bayesiano e frequentista, e lo applica anche ad un esempio di lancio di monete. Dovrebbe chiarire la discussione sulle ipotesi del paradigma frequentista. In realtà usa un'estensione più ampia del teorema della rappresentazione che va oltre il modello binomiale, ma dovrebbe comunque essere utile.


C'è forse una versione di questo documento che hai? Non ho accesso atm :-(
IMA

1
@Stats Ho letto quel documento dopo aver visto la tua risposta. Devo dire che questo è il miglior documento che illustra Bayesiano e Frequentista su quel tema che io abbia mai visto. Vorrei aver letto questo documento molto prima. (+1)
KevinKim,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.