Aggiornamento : con il senno di poi alcuni anni, ho scritto un trattamento più conciso dello stesso materiale essenzialmente in risposta a una domanda simile.
Come costruire una regione di fiducia
Cominciamo con un metodo generale per costruire regioni di fiducia. Può essere applicato a un singolo parametro, per produrre un intervallo di confidenza o una serie di intervalli; e può essere applicato a due o più parametri, per produrre regioni di confidenza dimensionale più elevate.
Affermiamo che le statistiche osservate provengono da una distribuzione con parametri , vale a dire la distribuzione campionaria su possibili statistiche , e cerchiamo una regione di confidenza per nell'insieme di possibili valori . Definire una regione a più alta densità (HDR): -HDR di un PDF è il sottoinsieme più piccolo del suo dominio che supporta la probabilità . Indica -HDR di come , per qualsiasi . Quindi, la regione di confidenza perDθs(d|θ)dθΘhhhs(d|ψ)Hψψ∈Θhθ, dati , è l'insieme . Un valore tipico di sarebbe 0,95.DCD={ϕ:D∈Hϕ}h
Un'interpretazione frequente
Dalla definizione precedente di una regione di confidenza segue
con . Ora immaginate un grande insieme di ( immaginari ) osservazioni , scattate in circostanze simili a . cioè Sono campioni da . Poiché supporta la massa di probabilità del PDF , per tutti . Pertanto, la frazione di per cui èd∈Hψ⟷ψ∈Cd
Cd={ϕ:d∈Hϕ}{ D i } D s ( d | θ ) H θ h s ( d | θ ) P ( D i ∈ H θ{Di}Ds(d|θ)Hθhs(d|θ)P(Di∈Hθ)=hi{Di}Di∈Hθh. E così, usando l'equivalenza sopra, la frazione di per la quale è anche .{Di}θ∈CDih
Questo, quindi, è ciò che il frequentista afferma per la regione di confidenza per equivale a:hθ
Prendere un gran numero di osservazioni immaginari dalla distribuzione campionaria che ha dato origine alla statistica osservata . Quindi, trova all'interno di una frazione delle regioni analoghe ma immaginarie di fiducia .{Di}s(d|θ)Dθh{CDi}
La regione di confidenza quindi non fa alcuna pretesa sulla probabilità che si trovi da qualche parte! Il motivo è semplicemente che non c'è nulla nella fomulazione che ci permetta di parlare di una distribuzione di probabilità su . L'interpretazione è solo una sovrastruttura elaborata, che non migliora la base. La base è solo e , dove non appare come quantità distribuita e non ci sono informazioni che possiamo usare per risolverlo. Esistono sostanzialmente due modi per ottenere una distribuzione su :CDθθs(d|θ)Dθθ
- Assegna una distribuzione direttamente dalle informazioni a portata di mano: .p(θ|I)
- Correlare con un'altra quantità distribuita: .θp(θ|I)=∫p(θx|I)dx=∫p(θ|xI)p(x|I)dx
In entrambi i casi, deve apparire a sinistra da qualche parte. I frequentatori non possono usare nessuno dei due metodi, poiché entrambi richiedono un precedente eretico.θ
Una vista bayesiana
Il più un bayesiano può fare della regione di confidenza , dato senza qualificazione, è semplicemente l'interpretazione diretta: che è l'insieme di per il quale cade nella -HDR della distribuzione campionaria . Non ci dice necessariamente molto su , ed ecco perché.hCDϕDhHϕs(d|ϕ)θ
La probabilità che , dati e le informazioni di base , sia:
Nota che, a differenza dell'interpretazione frequentista, abbiamo immediatamente richiesto una distribuzione su . Le informazioni di base ci dicono, come prima, che la distribuzione di campionamento è :
θ∈CDDIP(θ∈CD|DI)=∫CDp(θ|DI)dθ=∫CDp(D|θI)p(θ|I)p(D|I)dθ
θIs(d|θ)P(θ∈CD|DI)i.e.P(θ∈CD|DI)=∫CDs(D|θ)p(θ|I)p(D|I)dθ=∫CDs(D|θ)p(θ|I)dθp(D|I)=∫CDs(D|θ)p(θ|I)dθ∫s(D|θ)p(θ|I)dθ
hhCDθhh
Ora questa espressione non valuta in generale , vale a dire, la regione di confidenza non contiene sempre con probabilità . In effetti può essere nettamente diverso da . Ci sono, tuttavia, molte situazioni comuni in cui si fa valutare dahhCDθhhh, motivo per cui le regioni di fiducia sono spesso coerenti con le nostre intuizioni probabilistiche.
Ad esempio, supponiamo che il precedente PDF congiunto di e sia simmetrico in quel . (Chiaramente questo implica un presupposto che il PDF spazia sullo stesso dominio in e .) Quindi, se il precedente è , abbiamo . Quindi
Dalla definizione di un HDR lo sappiamo per qualsiasidθpd,θ(d,θ|I)=pd,θ(θ,d|I)dθp(θ|I)=f(θ)s(D|θ)p(θ|I)=s(D|θ)f(θ)=s(θ|D)f(D)P(θ∈CD|DI)i.e.P(θ∈CD|DI)=∫CDs(θ|D)dθ∫s(θ|D)dθ=∫CDs(θ|D)dθ
ψ∈Θ
∫Hψs(d|ψ)ddand therefore that∫HDs(d|D)ddor equivalently∫HDs(θ|D)dθ=h=h=h
Pertanto, dato che , implica . L'antecedente soddisfa
Applicazione dell'equivalenza nella parte superiore:
Pertanto, l'area di confidenza contienes(d|θ)f(θ)=s(θ|d)f(d)CD=HDP(θ∈CD|DI)=hCD=HD⟷∀ψ[ψ∈CD↔ψ∈HD]
CD=HD⟷∀ψ[D∈Hψ↔ψ∈HD]
CDθcon probabilità se per tutti i possibili valori di , -HDR di contiene se e solo se -HDR di contiene .hψθhs(d|ψ)Dhs(d|D)ψ
Ora la relazione simmetrica è soddisfatta per tutti quando per tutti che abbraccia il supporto di e . Possiamo quindi formare il seguente argomento:D∈Hψ↔ψ∈HDψs(ψ+δ|ψ)=s(D−δ|D)δs(d|D)s(d|ψ)
- s(d|θ)f(θ)=s(θ|d)f(d) (premessa)
- ∀ψ∀δ[s(ψ+δ|ψ)=s(D−δ|D)] (premessa)
- ∀ψ∀δ[s(ψ+δ|ψ)=s(D−δ|D)]⟶∀ψ[D∈Hψ↔ψ∈HD]
- ∴∀ψ[D∈Hψ↔ψ∈HD]
- ∀ψ[D∈Hψ↔ψ∈HD]⟶CD=HD
- ∴CD=HD
- [s(d|θ)f(θ)=s(θ|d)f(d)∧CD=HD]⟶P(θ∈CD|DI)=h
- ∴P(θ∈CD|DI)=h
Appliciamo l'argomento a un intervallo di confidenza sulla media di una distribuzione normale 1-D , data una media di esempio da misurazioni. Abbiamo e , in modo che la distribuzione di campionamento sia
Supponi anche che non sappiamo nulla di prima di prendere i dati (tranne che è una posizione parametro) e quindi assegnare un precedente uniforme: . Chiaramente ora abbiamo , quindi la prima premessa è soddisfatta. Permettere(μ,σ)x¯nθ=μd=x¯s(d|θ)=n−−√σ2π−−√e−n2σ2(d−θ)2
θf(θ)=ks(d|θ)f(θ)=s(θ|d)f(d)s(d|θ)=g((d−θ)2) . (cioè può essere scritto in quel formato.) Quindi
al termine della seconda premessa. Essendo entrambe le premesse vere, l'argomento in otto punti ci porta a concludere che la probabilità che risieda nell'intervallo di confidenza è !s(ψ+δ|ψ)=g((ψ+δ−ψ)2)=g(δ2)ands(D−δ|D)=g((D−δ−D)2)=g(δ2)so that∀ψ∀δ[s(ψ+δ|ψ)=s(D−δ|D)]
θCDh
Abbiamo quindi un'ironia divertente:
- Il frequentatore che assegna l' intervallo di confidenza non può dire che , non importa quanto innocentemente uniforme sia prima di incorporare i dati.hP(θ∈CD)=hθ
- Il bayesiano che non assegnerebbe un intervallo di confidenza in quel modo sa comunque che .hP(θ∈CD|DI)=h
Osservazioni finali
Abbiamo identificato le condizioni (ovvero le due premesse) in base alle quali la regione di confidenza produce effettivamente probabilità che . Un frequentatore si fermerà alla prima premessa, perché comporta un precedente su , e questo tipo di patto è inevitabile sulla strada per una probabilità. Ma per un bayesiano è accettabile --- no, essenziale. Queste condizioni sono sufficienti ma non necessarie, quindi ci sono molte altre circostanze in cui la Bayesiana uguale a . Allo stesso modo, ci sono molte circostanze in cui , specialmente quando le informazioni precedenti sono significative.hhθ∈CDθP(θ∈CD|DI)hP(θ∈CD|DI)≠h
Abbiamo applicato un'analisi bayesiana proprio come un costante bayesiana Sarebbe, date le informazioni a portata di mano , comprese le statistiche . Ma un bayesiano, se possibile, applicherà i suoi metodi alle misure grezze invece --- a , piuttosto che a . Spesso, la compressione dei dati grezzi in statistiche riassuntive distrugge le informazioni nei dati; e quindi le statistiche riassuntive non sono in grado di parlare in modo eloquente dei dati originali sui parametri .D{xi}x¯Dθ