Ci sono esempi in cui gli intervalli credibili bayesiani sono ovviamente inferiori agli intervalli di confidenza del frequentatore


81

Una recente domanda sulla differenza tra confidenza e intervalli credibili mi ha portato a iniziare a rileggere l'articolo di Edwin Jaynes su questo argomento:

Jaynes, ET, 1976. "Intervalli di confidenza contro intervalli bayesiani", in Fondamenti di teoria della probabilità, inferenza statistica e teorie statistiche della scienza, WL Harper e CA Hooker (a cura di), D. Reidel, Dordrecht, p. 175; ( pdf )

In astratto, Jaynes scrive:

... esponiamo le soluzioni bayesiane e ortodosse a sei problemi statistici comuni che coinvolgono intervalli di confidenza (compresi test di significatività basati sullo stesso ragionamento). In ogni caso, troviamo che la situazione è esattamente l'opposto, vale a dire che il metodo bayesiano è più facile da applicare e produce gli stessi risultati o migliori. In effetti, i risultati ortodossi sono soddisfacenti solo quando concordano strettamente (o esattamente) con i risultati bayesiani. Nessun esempio contrario è stato ancora prodotto.

(enfatizzare il mio)

Il documento è stato pubblicato nel 1976, quindi forse le cose sono andate avanti. La mia domanda è: ci sono esempi in cui l'intervallo di confidenza del frequentista è chiaramente superiore all'intervallo credibile bayesiano (secondo la sfida implicitamente fatta da Jaynes)?

Gli esempi basati su presupposti precedenti errati non sono accettabili in quanto non dicono nulla sulla coerenza interna dei diversi approcci.


21
In base a ipotesi piuttosto lievi, (a) le procedure di stima bayesiane sono ammissibili e (b) tutti o quasi tutti gli stimatori ammissibili sono bayesiani rispetto ad alcuni precedenti. Quindi non sorprende che un intervallo di confidenza bayesiana "produca gli stessi risultati o migliori". Nota che le mie affermazioni (a) e (b) fanno parte dell'analisi frequentista della teoria delle decisioni razionali. Laddove i frequentisti si separano dai bayesiani non si occupa della matematica o delle procedure statistiche, ma riguarda il significato, la giustificazione e l'uso corretto di un precedente per qualsiasi problema particolare.
whuber

1
Quindi, il commento di cui sopra implica che la risposta alla domanda del PO è "Nessun esempio del genere può essere costruito". O forse esiste qualche esempio patologico che viola le ipotesi alla base della ricevibilità?

1
@Srikant: bella domanda. Penso che il punto di partenza per indagare sia una situazione in cui vi sono stimatori non Bayes ammissibili - non necessariamente uno "patologico", ma almeno uno che offre l'opportunità di trovare un "esempio contrario".
whuber

2
Vorrei aggiungere un po 'di chiarezza alle "assunzioni precedenti errate ..." affermando che la risposta bayesiana e la risposta del frequentatore devono fare uso delle stesse informazioni , altrimenti si stanno solo confrontando le risposte a due domande diverse. Grande domanda però (+1 da parte mia)
Probislogic

3
patologia o no, sarebbe probabilmente il primo del suo genere. Sono molto desideroso di vedere questo esempio, poiché queste "patologie" di solito hanno un buon elemento di apprendimento per loro
probabilitlogico

Risposte:


52

Ho detto prima che avrei provato a rispondere alla domanda, quindi ecco qui ...

Jaynes era un po 'cattivo nel suo articolo in quanto un intervallo di confidenza frequentista non è definito come un intervallo in cui potremmo aspettarci che il vero valore della statistica risieda con un'alta probabilità (specificata), quindi non è eccessivamente sorprendente che le contraddizioni sorgono se vengono interpretati come se lo fossero. Il problema è che questo è spesso il modo in cui gli intervalli di confidenza vengono utilizzati nella pratica, in quanto un intervallo che contiene altamente il vero valore (dato ciò che possiamo dedurre dal nostro campione di dati) è ciò che spesso desideriamo.

La questione chiave per me è che quando viene posta una domanda, è meglio avere una risposta diretta a quella domanda. Il fatto che gli intervalli credibili bayesiani siano peggiori degli intervalli di confidenza del frequentista dipende dalla domanda effettivamente posta. Se la domanda era:

(a) "Dammi un intervallo in cui il vero valore della statistica risieda con la probabilità p", quindi sembra che un frequentatore non possa effettivamente rispondere direttamente a questa domanda (e questo introduce il tipo di problemi che Jaynes discute nel suo documento), ma un Latta bayesiana, motivo per cui un intervallo credibile bayesiano è superiore all'intervallo di confidenza frequentista negli esempi forniti da Jaynes. Ma questo è solo perché è la "domanda sbagliata" per il frequentatore.

(b) "Dammi un intervallo in cui, se l'esperimento fosse ripetuto un gran numero di volte, il vero valore della statistica rientrerebbe in p * 100% di tali intervalli", allora la risposta del frequentatore è proprio quello che vuoi. Il bayesiano potrebbe anche essere in grado di dare una risposta diretta a questa domanda (anche se potrebbe non essere semplicemente l'intervallo credibile evidente). Il commento di Whuber sulla domanda suggerisce che questo è il caso.

Quindi, in sostanza, si tratta di specificare correttamente la domanda e di interpretare correttamente la risposta. Se si desidera porre la domanda (a), utilizzare un intervallo credibile bayesiano, se si desidera porre la domanda (b), utilizzare un intervallo di confidenza frequentista.


2
Ben detto, soprattutto su quale domanda un CI risponde realmente. Nell'articolo di Jaynes, tuttavia, egli menziona il fatto che le CI (e le procedure più frequenti) sono progettate per funzionare bene "a lungo termine" (ad es. Con quale frequenza vedi o "per grande n la distribuzione è approssimativamente. .. "ipotesi in metodi frequentisti?), ma ci sono molte procedure di questo tipo che possono farlo. Penso che sia qui che le tecniche frequentiste (coerenza, inclinazione, convergenza, ecc.) Possono essere utilizzate per valutare varie procedure bayesiane che sono difficili da decidere tra. n
Probislogic,

1
"Jaynes era un po 'cattivo nei suoi articoli ..." Penso che il punto che Jaynes stava cercando di fare (o il punto che ho preso da esso) è che gli intervalli di confidenza sono usati per rispondere alla domanda a) in un gran numero di casi (speculerei sul fatto che chiunque abbia solo una formazione da frequentatore userà gli IC per rispondere alla domanda a) e penserà di essere una risposta frequentista appropriata)
Probislogic

2
sì, per "un po 'cattivo" volevo solo dire che Jaynes stava spiegando la questione in modo alquanto malizioso (ma anche divertente) (o almeno è così che l'ho letto). Ma se non lo avesse fatto, probabilmente non avrebbe avuto alcun impatto.
Dikran Marsupial,

23

Questo è un esempio "arricchito" dato in un libro scritto da Larry Wasserman Tutte le statistiche su Pagina 216 ( 12.8 Punti di forza e debolezze dell'inferenza bayesiana ). Fondamentalmente fornisco ciò che Wasserman non ha nel suo libro 1) una spiegazione di ciò che sta realmente accadendo, piuttosto che una linea di lancio; 2) la risposta del frequentatore alla domanda, che Wasserman non dà convenientemente; e 3) una dimostrazione che la confidenza equivalente calcolata utilizzando le stesse informazioni soffre dello stesso problema.

In questo esempio, afferma la seguente situazione

  1. (X|θ)N(θ,1)
  2. (θ)N(0,1)τ2τ2=1

θθ

... Cosa dovremmo concludere da tutto questo? L'importante è capire che i metodi frequentista e bayesiano stanno rispondendo a domande diverse. Per combinare le credenze precedenti con i dati in modo di principio, usa l'inferenza bayesiana. Per costruire procedure con prestazioni a lungo termine garantite, come intervalli di confidenza, utilizzare metodi frequentist ... (p217)

E poi continua senza alcuna disezione o spiegazione del perché il metodo bayesiano abbia funzionato apparentemente così male. Inoltre, non dà una risposta dall'approccio del frequentista, ma solo una dichiarazione a pennello sul "lungo periodo" - una tattica politica classica (enfatizza la tua forza + la debolezza degli altri, ma non confrontare mai come per simili).

τ=1

θN(0,1)θp(θ)1YN(θ,1)Xθ

p(θ|Y)p(θ)p(Y|θ)exp(12(Yθ)2)

(θ|Y)N(Y,1)X00X

θx¯=0+X2=X2

(x¯|θ)N(θ,12)

(1α)%

12X±Zα/212

(1α)%θ

cX±cZα/2

c=τ21+τ2τ2=1c=12

12X±Zα/212

p(θ)1X±Zα/2)

X=00θ=4X0θ=4. In effetti puoi mostrare che questo esempio è sostanzialmente equivalente a mostrare che la media aritmetica ha una funzione di influenza illimitata.

τ=1τ2=1N (N=0,1,2,3,)NX0Xθ0θ0


1
Grazie per l'analisi AFAICS questo è solo un esempio di un problema causato da un'errata assunzione (informativa) precedente e non dice nulla sulla coerenza interna dell'approccio bayesiano?
Dikran Marsupial,

1
0θ

0X0XθθX0X0θθ
Probislogic,

10

Keith Winstein,

EDIT: Giusto per chiarire, questa risposta descrive l'esempio fornito nella risposta Keith Winstein sul re con il crudele gioco statistico. Le risposte Bayesiana e Frequentista utilizzano entrambe le stesse informazioni, ovvero ignorare le informazioni sul numero di monete giuste e ingiuste durante la costruzione degli intervalli. Se queste informazioni non vengono ignorate, il frequentatore dovrebbe usare la probabilità beta-binomiale integrata come distribuzione campionaria nella costruzione dell'intervallo di confidenza, nel qual caso l'intervallo di confidenza Clopper-Pearson non è appropriato e deve essere modificato. Un aggiustamento simile dovrebbe avvenire nella soluzione bayesiana.

EDIT: ho anche chiarito l'uso iniziale del clopper Pearson Interval.

EDIT: ahimè, la mia alfa è la strada sbagliata e il mio intervallo Pearson clopper non è corretto. Le mie più umili scuse a @whuber, che lo ha correttamente sottolineato, ma con cui inizialmente non ero d'accordo e ho ignorato.

L'IC che utilizza il metodo Clopper Pearson è molto buono

θ

[Pr(Bi(1,θ)X)α2][Pr(Bi(1,θ)X)α2]

X=1Pr(Bi(1,θ)1)=θPr(Bi(1,θ)1)=1θα21α2X=1X=0Pr(Bi(1,θ)0)=1Pr(Bi(1,θ)0)=1θ1θα2θ1α2X=0[0.025,1]X=1[0,0.975]X=0

Pertanto, chi usa l'intervallo di confidenza di Clopper Pearson non verrà mai decapitato. Osservando l'intervallo, è sostanzialmente l'intero spazio dei parametri. Ma l'intervallo CP lo sta facendo dando una copertura del 100% a un intervallo presumibilmente del 95%! Fondamentalmente, i Frequentisti "imbrogliano" dando un intervallo di confidenza del 95% più copertura di quello che gli è stato chiesto di dare (anche se chi non trufferebbe in una situazione del genere? Se fossi in me, darei l'intero [0, 1] intervallo). Se il re chiedesse un esatto IC al 95%, questo metodo frequentista fallirebbe indipendentemente da ciò che è realmente accaduto (forse ne esiste uno migliore?).

Che dire dell'intervallo bayesiano? (in particolare l'intervallo bayesiano di massima designità posteriore (HPD))

(θ|X)Beta(1+X,2X)Pr(θθe|x=1)=1(θe)2Pr(θθe|x=0)=1(1θe)2θe=0.050.224X=1θe=10.050.776X=0(0,0.776)X=0(0.224,1)X=1

11012+1×1100

0.1

0.0250.975

Per citare un vero intervallo di confidenza al 95%, quindi per definizione ci dovrebbero essere alcuni casi (cioè almeno uno) dell'intervallo osservato che non contengono il vero valore del parametro . Altrimenti, come si può giustificare il tag 95%? Non sarebbe solo un valido o non valido chiamarlo un intervallo del 90%, 50%, 20% o anche 0%?

Non vedo quanto sia semplicemente soddisfacente affermare che "in realtà significa il 95% o più" senza una limitazione gratuita. Questo perché l'ovvia soluzione matematica è l'intero spazio dei parametri e il problema è banale. supponiamo che io voglia un 50% CI? se limita solo i falsi negativi, l'intero spazio dei parametri è un elemento della configurazione valido utilizzando solo questi criteri.

100%X=0100×1012+9101012+1%>95%X=1

In conclusione, sembra un po 'strano chiedere un intervallo di incertezza, e quindi valutare quell'intervallo usando il valore vero di cui eravamo incerti. Un confronto "più equo", sia per la fiducia che per gli intervalli credibili, per me sembra la verità della dichiarazione di incertezza fornita con l'intervallo .


α1α

1012α1α

1012α1α1α21θθ

Intendi la risposta di @Keith Winstein?
whuber

@whuber, sì, intendo la risposta di Keith Winstein.
Probislogic,

9

Il problema inizia con la tua frase:

Gli esempi basati su presupposti precedenti errati non sono accettabili in quanto non dicono nulla sulla coerenza interna dei diversi approcci.

Sì bene, come fai a sapere che il tuo precedente è corretto?

Prendi il caso dell'inferenza bayesiana nella filogenesi. La probabilità di almeno un cambiamento è correlata al tempo evolutivo (lunghezza del ramo t) dalla formula

P=1e43ut

con te il tasso di sostituzione.

Ora vuoi fare un modello dell'evoluzione, basato sul confronto delle sequenze di DNA. In sostanza, si tenta di stimare un albero in cui si tenta di modellare la quantità di cambiamento tra le sequenze di DNA il più vicino possibile. La P sopra è la possibilità di almeno un cambiamento su un determinato ramo. I modelli evolutivi descrivono le possibilità di cambiamento tra due nucleotidi e da questi modelli evolutivi viene derivata la funzione di stima, con p come parametro o con t come parametro.

Non hai una conoscenza ragionevole e hai scelto un appartamento precedente per p. Ciò implica intrinsecamente un precedente in diminuzione esponenziale per t. (Diventa ancora più problematico se si desidera impostare un precedente piatto su t. Il precedente implicito su p dipende fortemente da dove si è tagliato l'intervallo di t.)

In teoria, t può essere infinito, ma quando si consente un intervallo infinito, anche l'area sotto la sua funzione di densità è uguale all'infinito, quindi è necessario definire un punto di troncamento per il precedente. Ora, quando si sceglie il punto di troncamento sufficientemente grande, non è difficile dimostrare che entrambe le estremità dell'intervallo credibile aumentano, e ad un certo punto il vero valore non è più contenuto nell'intervallo credibile. A meno che tu non abbia una buona idea del precedente, i metodi bayesiani non sono garantiti come uguali o superiori ad altri metodi.

ref: Joseph Felsenstein: Inferring Phylogenies, capitolo 18

Da un lato, mi sto stufando di quel litigio bayesiano / frequentista. Sono entrambi quadri diversi, e nemmeno la Verità Assoluta. Gli esempi classici pro metodi bayesiani provengono invariabilmente dal calcolo della probabilità, e non un solo frequentatore li contraddice. L'argomentazione classica contro i metodi bayesiani implica invariantemente la scelta arbitraria di un priore. E i priori sensibili sono sicuramente possibili.

Tutto si riduce all'uso corretto di entrambi i metodi al momento giusto. Ho visto pochissimi argomenti / confronti in cui entrambi i metodi sono stati applicati correttamente. I presupposti di qualsiasi metodo sono molto sottovalutati e troppo spesso ignorati.

EDIT: per chiarire, il problema sta nel fatto che la stima basata su p differisce dalla stima basata su t nel quadro bayesiano quando si lavora con priori non informativi (che in alcuni casi è l'unica soluzione possibile). Ciò non è vero nel quadro ML per l'inferenza filogenetica. Non si tratta di un precedente sbagliato, è inerente al metodo.


3
È possibile essere interessati alle differenze tra statistiche bayesiane e frequentiste senza che si tratti di una lite. È importante conoscere i difetti e i vantaggi di un approccio preferito. Ho specificamente escluso i priori in quanto questo non è un problema con il framework, di per sé, ma solo una questione di GIGO. Lo stesso vale per le statistiche dei frequentisti, ad esempio ipotizzando una distribuzione parametrica errata per i dati. Non sarebbe una critica alla metodologia frequentista, solo il metodo particolare. A proposito, non ho particolari problemi con i priori impropri.
Dikran Marsupial,

3
Primo esempio di Jaynes: nessuno statistico nella sua mente corretta utilizzerà mai un test F e un test T su quel set di dati. A parte questo, confronta un test a due code con P (b> a), che non è la stessa ipotesi testata. Quindi il suo esempio non è giusto, che essenzialmente ammette in seguito. Accanto a questo, non è possibile confrontare "i framework". Di cosa stiamo parlando allora? ML, REML, LS, metodi penalizzati, ...? intervalli per coefficienti, statistiche, previsioni, ...? Puoi anche chiedere se il servizio luterano è equivalente o superiore ai servizi sciiti. Parlano dello stesso Dio.
Joris Meys,

Potresti chiarire quali sono i tuoi dati e quali sono i parametri che stimeresti nel tuo modello? Sono un po 'confuso su questo punto. Inoltre, potresti utilizzare $$ anziché $ per centrare la formula? La dimensione del carattere è molto piccola in questo momento.

@Srikant: l'esempio nel libro di Felsensteins si basa su un modello di Jukes-Cantor per l'evoluzione del DNA. I dati sono sequenze di DNA. Si desidera stimare la probabilità di cambiamento nella sequenza, correlata alla lunghezza del ramo in base alla formula menzionata. Le lunghezze dei rami sono definite come tempo di evoluzione: maggiore è la possibilità di cambiamenti, più tempo è trascorso tra l'antenato e lo stato attuale. Mi dispiace, ma non posso riassumere l'intera teoria dietro ML e inferenza filogenetica bayesiana in un solo post. Felsenstein aveva bisogno di mezzo libro per quello.
Joris Meys,

Immagino che volevo solo che tu chiarissi quali variabili nella tua equazione erano dati e quali erano i parametri in quanto non era chiaro dal tuo post soprattutto per qualcuno come me che è un estraneo. Mi sono ancora perso, ma credo che avrei bisogno di leggere il libro per saperne di più.

8

Gli intervalli di confidenza frequentista limitano il tasso di falsi positivi (errori di tipo I) e garantiscono che la loro copertura sarà limitata dal parametro di confidenza, anche nel caso peggiore. Gli intervalli di credibilità bayesiana no.

Quindi, se la cosa a cui tieni sono i falsi positivi e devi limitarli, gli intervalli di confidenza sono l'approccio che vorrai usare.

Ad esempio, supponiamo che tu abbia un re malvagio con un tribunale di 100 cortigiani e cortigiani e che vuole giocare un crudele gioco statistico con loro. Il re ha una borsa di trilioni di monete giuste, più una moneta ingiusta la cui probabilità di testa è del 10%. Eseguirà il seguente gioco. Innanzitutto, estrarrà una moneta in modo uniforme a caso dalla borsa.

Quindi la moneta verrà passata in una stanza di 100 persone e ognuna sarà costretta a fare un esperimento su di essa, in privato, e quindi ogni persona indicherà un intervallo di incertezza del 95% su ciò che pensano sia la probabilità della testa della moneta.

Chiunque dia un intervallo che rappresenta un falso positivo - cioè un intervallo che non copre il vero valore della probabilità delle teste - verrà decapitato.

Se volessimo esprimere la funzione di distribuzione / a posteriori / probabilità del peso della moneta, ovviamente un intervallo di credibilità è quello che fa. La risposta sarà sempre l'intervallo [0,5, 0,5] indipendentemente dal risultato. Anche se capovolgi zero teste o una testa, dirai comunque [0,5, 0,5] perché è molto più probabile che il re abbia pescato una moneta giusta e tu abbia avuto un giorno 1/1024 ottenendo dieci teste di fila , che il re estrasse la moneta ingiusta.

Quindi questa non è una buona idea da usare per i cortigiani e le cortigiane! Perché quando viene estratta la moneta ingiusta, l'intera stanza (tutte e 100 le persone) sarà sbagliata e verranno tutti decapitati.

In questo mondo in cui la cosa più importante sono i falsi positivi, ciò di cui abbiamo bisogno è una garanzia assoluta che il tasso di falsi positivi sarà inferiore al 5%, indipendentemente dalla moneta pescata. Quindi dobbiamo usare un intervallo di confidenza, come Blyth-Still-Casella o Clopper-Pearson, che funzioni e fornisce almeno il 95% di copertura indipendentemente dal vero valore del parametro, anche nel caso peggiore . Se invece tutti usano questo metodo, quindi, indipendentemente dalla moneta pescata, alla fine della giornata possiamo garantire che il numero previsto di persone sbagliate non sarà più di cinque.

Quindi il punto è: se il tuo criterio richiede di limitare i falsi positivi (o equivalentemente, garantire la copertura), devi andare con un intervallo di confidenza. Questo è quello che fanno. Gli intervalli di credibilità possono essere un modo più intuitivo per esprimere l'incertezza, possono funzionare abbastanza bene da un'analisi frequentista, ma non forniranno il limite garantito ai falsi positivi che otterrai quando vai a chiederlo.

(Naturalmente se ti interessano anche i falsi negativi, avrai bisogno di un metodo che garantisca anche quelli ...)


6
Spunti di riflessione, tuttavia l'esempio particolare è ingiusto in quanto l'approccio frequentista è autorizzato a considerare i costi relativi dei costi falsi positivi e falsi negativi, mentre l'approccio bayesiano non lo è. La cosa corretta da fare secondo la teoria delle decisioni bayesiane è dare un intervallo di [0,1] in quanto non vi è alcuna penalità associata ai falsi negativi. Pertanto, in un confronto omogeneo di strutture, nessuno dei bayesiani sarebbe mai stato decapitato. Il problema di limitare i falsi positivi mi dà però una direzione in cui cercare una risposta alla sfida di Jaynes.
Dikran Marsupial,

1
Nota anche che se la moneta selezionata viene lanciata abbastanza spesso, alla fine l'intervallo di confidenza bayesiana sarà centrato sulla frequenza a lungo termine delle teste per la moneta particolare piuttosto che sulla precedente. Se la mia vita dipendesse dall'intervallo contenente la vera probabilità di una testa, non lancerei la moneta solo una volta!
Dikran Marsupial,

1
Dopo aver riflettuto un po 'di più su questo, questo esempio non è valido poiché il criterio utilizzato per misurare il successo non è lo stesso di quello implicito dalla domanda posta dal re. Il problema è nella "non importa quale moneta venga pescata", una clausola progettata per inciampare in qualsiasi metodo che utilizza la conoscenza precedente sulla rarità della moneta distorta. Di fatto, Bayesains può derivare anche dei limiti (ad es. Limiti PAC) e, se richiesto, l'avrebbe fatto, e sospetto che la risposta sarebbe la stessa dell'intervallo Clopper-Pearson. Per essere un test equo, è necessario fornire le stesse informazioni a entrambi gli approcci.
Dikran Marsupial,

1
Dikran, non ci devono essere "bayesiani" e "frequentatori". Non sono scuole di filosofia incompatibili alle quali si può iscriversi a una sola! Sono strumenti matematici la cui efficacia può essere dimostrata nel quadro comune della teoria della probabilità. Il mio punto è che SE il requisito è un limite assoluto di falsi positivi, indipendentemente dal vero valore del parametro, ALLORA un intervallo di confidenza è il metodo che lo realizza. Ovviamente siamo tutti d'accordo sugli stessi assiomi della probabilità e la stessa risposta può essere derivata in molti modi.
Keith Winstein,

1
[0.1,0.5]0.10.5100%95%
Probislogic,

0

ci sono esempi in cui l'intervallo di confidenza del frequentista è chiaramente superiore all'intervallo credibile bayesiano (secondo la sfida implicitamente fatta da Jaynes).

θ10θ1θ

Bernardo ha proposto un "riferimento precedente" da utilizzare come standard per la comunicazione scientifica [e persino un "intervallo credibile di riferimento" ( Bernardo - regioni credibili oggettive )]. Supponendo che questo sia "l'approccio bayesiano", ora la domanda è: quando un intervallo è superiore a un altro? Le proprietà frequentiste dell'intervallo bayesiano non sono sempre ottimali, ma nemmeno le proprietà bayesiane dell '"intervallo frequentista"
(a proposito, qual è "l'" intervallo frequentista?)


Sto speculando, ma sospetto che questa risposta sia destinata a ricevere lo stesso trattamento di altri. Qualcuno sosterrà semplicemente che si tratta di una questione di scarsa scelta delle procedure bayesiane precedenti e non intrinseche, che a mio avviso tenta parzialmente di eludere una valida critica.
cardinale

Il commento di @ cardinal è giusto. Il priore qui è fuori di un ordine di grandezza, rendendo la critica molto debole. Le informazioni preliminari sono importanti anche per i frequentatori; ciò che si conosce a priori dovrebbe determinare, ad esempio, quali stime e statistiche di test vengono utilizzate. Se queste scelte si basano su informazioni errate di un ordine di grandezza, dovrebbero essere previsti scarsi risultati; essere bayesiano o frequentista non ci entra.
ospite

Il mio "esempio" non era la parte importante della mia risposta. Ma qual è una buona scelta di precedenti? È facile immaginare un priore il cui supporto contenga il vero parametro ma il posteriore no, quindi l'intervallo frequentista è superiore?
Stéphane Laurent,

Il cardinale e l'ospite hanno ragione, la mia domanda includeva esplicitamente "Gli esempi basati su ipotesi precedenti errate non sono accettabili in quanto non dicono nulla sulla coerenza interna dei diversi approcci". per una buona ragione. I test per frequentista possono basarsi su ipotesi errate e bayesiane (la struttura bayesiana afferma le ipotesi in modo più esplicito); la domanda è se il quadro presenta punti deboli. Anche se il valore vero fosse nel precedente, ma non in quello posteriore, ciò implicherebbe che le osservazioni escludessero la possibilità che il valore vero fosse corretto!
Dikran Marsupial,

1
Forse dovrei modificare la mia risposta ed eliminare il mio "esempio" - questa non è la parte seria della mia risposta. La mia risposta era principalmente sul significato dell '"approccio bayesiano". Come si chiama l'approccio bayesiano? Questo approccio richiede la scelta di un priore soggettivo o utilizza un modo automatico per selezionare un priore non informativo? Nel secondo caso è importante menzionare il lavoro di Bernardo. In secondo luogo non hai definito la relazione di "superiorità" tra gli intervalli: quando dici che un intervallo è superiore a un altro?
Stéphane Laurent,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.