Priori disinformatori bayesiani contro ipotesi nulle del frequentista: qual è la relazione?


11

Mi sono imbattuto in questa immagine in un post sul blog qui .

Qualcuno in un pozzo di mosh sperimentando un EUREKA!  momento

Sono rimasto deluso dal fatto che leggere la dichiarazione non abbia suscitato per me la stessa espressione facciale che ha fatto per questo ragazzo.

Quindi, cosa si intende per l'affermazione secondo cui l'ipotesi nulla è come i frequentisti esprimano un precedente non informativo? È veramente vero?


Modifica: spero che qualcuno possa offrire un'interpretazione di beneficenza che renda vera l'affermazione, anche in un certo senso.


3
Non penso sia accurato. Primo, qualcuno può scrivere la probabilità di un test T? Quindi possiamo iniziare a parlare di analogie. Bene, e se non puoi ... vedremo che l'immagine non ha senso.
joint_p

Risposte:


10

L'ipotesi nulla non equivale a un precedente disinformativo bayesiano per la semplice ragione che i bayesiani possono anche usare ipotesi null ed eseguire test di ipotesi utilizzando i fattori di Bayes. Se fossero equivalenti, i bayesiani non userebbero ipotesi nulle.

Tuttavia, sia il test dell'ipotesi frequentista che quello bayesiano incorporano un elemento di auto-scetticismo, in quanto ci viene richiesto di dimostrare che ci sono alcune prove che la nostra ipotesi alternativa è in qualche modo una spiegazione più plausibile per le osservazioni rispetto alla casualità. I frequentatori lo fanno avendo un livello di significatività, i bayesiani lo fanno avendo una scala di interpretazione per il fattore Bayes, in modo tale da non divulgare fortemente un'ipotesi se il fattore Bayes sull'ipotesi nulla fosse sufficientemente alto.

Ora il motivo per cui i test di ipotesi del frequentista sono controintuitivi è perché un frequentista non può assegnare una probabilità non banale alla verità di un'ipotesi, che purtroppo è generalmente ciò che realmente vogliamo. Il più vicino che riescono ad arrivare a questo è calcolare il valore p (la probabilità delle osservazioni sotto H0) e quindi trarre una conclusione soggettiva da questo se H0 o H1 sono plausibili. Il bayesiano può assegnare una probabilità alla verità di un'ipotesi, e quindi può elaborare il rapporto di queste probabilità per fornire un'indicazione delle loro plausibilità relative, o almeno di come le osservazioni cambiano il rapporto di queste probabilità (che è ciò che un Il fattore Bayes lo fa).

A mio avviso, è una cattiva idea provare a fare un parallelo troppo stretto tra i metodi di verifica dell'ipotesi frequentista e bayesiana poiché sono fondamentalmente diversi e rispondono a domande fondamentalmente diverse. Trattarli come se fossero equivalenti incoraggia un'interpretazione bayesiana del test del frequentista (ad esempio l'errore di p-value) che è potenzialmente pericoloso (ad esempio gli scettici climatici spesso assumono che la mancanza di una tendenza statisticamente significativa nella temperatura media della superficie globale significhi che lì non è stato il riscaldamento - che non è affatto corretto).


9

La ragione per cui non hai lo stesso aspetto epifanico sul viso di quel ragazzo è che penso che. . . l'affermazione non è vera.

Un'ipotesi nulla è l'ipotesi che qualsiasi differenza tra il controllo e le condizioni sperimentali sia dovuta al caso.

Un precedente non informativo ha lo scopo di affermare che hai dati precedenti su una domanda, ma che non ti dice nulla su cosa aspettarti la prossima volta. È probabile che un bayesiano sostenga che ci siano informazioni in qualsiasi distribuzione precedente, persino uniforme.

Quindi l'ipotesi nulla dice che non c'è differenza tra controllo e sperimentale; un precedente non informativo può invece essere o non essere possibile, e se ciò non indicherebbe nulla sulla differenza tra controllo e sperimentazione (che è diversa dall'indicare che qualsiasi differenza è dovuta al caso).

Forse però mi manca la comprensione dei priori non informativi. Non vedo l'ora di altre risposte.


2
Vorrei solo aggiungere che i priori non informativi riguardano più l'atteggiamento del ricercatore che qualsiasi proprietà particolarmente interessante della distribuzione stessa. Questo è l'atteggiamento che Gelman sostiene nell'analisi dei dati bayesiana, sebbene non riesca a trovare il numero di pagina.
Sycorax dice di ripristinare Monica

7
L'ipotesi nulla non è sempre la stessa. L'ipotesi nulla è solo un'ipotesi "noiosa" alternativa che si confronta con la tua ipotesi "interessante", per vedere se i dati supportano l'uno sull'altro. In realtà, "nessuna differenza" è in realtà una cattiva ipotesi nulla, dal momento che sai a priori è falso. Meglio è "la differenza è al di sotto della soglia della mia attenzione".
Stumpy Joe Pete,

Grazie per la risposta @Krysta, e sostanzialmente ho avuto gli stessi pensieri sull'affermazione, ma forse c'è un senso in cui l'affermazione è in qualche modo vera?
Jerad,

La mia ipotesi migliore è che l'ipotesi nulla sia il punto di partenza per i frequentisti o l'insieme vuoto di ipotesi ?; forse questo scrittore pensa che il precedente non informativo sia il punto di partenza per i bayesiani, ma un normale precedente informativo è un analogo migliore se questo è ciò che intendevano dire. L'ipotesi nulla e il precedente non informativo hanno in qualche modo somiglianze concettuali: sono entrambe circa sul presupporre che non ci siano informazioni / effetti. Ma è piuttosto vago!
Krysta,

"È probabile che un bayesiano sostenga che ci siano informazioni in qualsiasi precedente". Ma un precedente di Jeffreys non è informativo.
Neil G,

4

Vedi questo articolo di Wikipedia :

Nel caso di un singolo parametro e dati che possono essere riassunti in una singola statistica sufficiente, si può dimostrare che l'intervallo credibile e l'intervallo di confidenza coincideranno se il parametro sconosciuto è un parametro di posizione (...) con un precedente che è una distribuzione piatta uniforme (...) e anche se il parametro sconosciuto è un parametro di scala (...) con un precedente di Jeffreys.

In effetti, il riferimento punta a Jaynes:

Jaynes, ET (1976), Confidence Intervals vs Bayesian Intervals .

Nella pagina 185 possiamo trovare:

Se sorge il caso (I) (e lo fa più spesso del previsto), i test bayesiani e ortodossi ci porteranno esattamente agli stessi risultati e alla stessa conclusione, con un disaccordo verbale sul fatto che dovremmo usare la "probabilità" o " significato 'per descriverli.

Quindi, in realtà ci sono casi simili, ma non direi che l'affermazione nell'immagine è vera se, ad esempio, stai usando una distribuzione di Cauchy come probabilità ...


4

Sono quello che ha creato la grafica, anche se, come notato nel post di accompagnamento, non è in origine la mia intuizione. Consentitemi di fornire un contesto per come è venuto e faccio del mio meglio per spiegare come lo capisco. La realizzazione è avvenuta durante una discussione con uno studente che aveva appreso principalmente l'approccio bayesiano all'inferenza fino a quel momento. Egli stava avendo un momento difficile comprendere l'intero paradigma verifica delle ipotesi, e mi stava facendo del mio meglio per spiegare questo approccio decisamente confusione (se si considera “differenza” per essere un negativo - come in nonuguale a - quindi l'approccio di ipotesi nulla standard è un triplo negativo: l'obiettivo dei ricercatori è quello di dimostrare che non vi è alcuna differenza). In generale, e come affermato in un'altra risposta, i ricercatori di solito si aspettano che esistano delle differenze; ciò che sperano davvero di trovare sono prove convincenti per "rifiutare" il nulla. Per essere imparziali, però, iniziano essenzialmente fingendo l'ignoranza, come in "Beh, forse questo farmaco non ha alcun effetto sulle persone". Quindi procedono a dimostrare attraverso la raccolta e l'analisi dei dati (se possibile), che questa ipotesi nulla, dati i dati, era una cattiva ipotesi.

Per un bayesiano, questo deve sembrare un punto di partenza contorto. Perché non iniziare semplicemente annunciando direttamente le tue precedenti convinzioni ed essere chiaro su ciò che stai (e non stai) assumendo codificandolo in un precedente? Un punto chiave qui è che un precedente uniforme non lo èlo stesso di un precedente non informativo. Se lancio una moneta 1000 volte e ottengo 500 teste, il mio nuovo precedente assegna un peso uguale (uniforme) sia a testa che a croce, ma la sua curva di distribuzione è molto ripida. Sto codificando informazioni aggiuntive che sono altamente informative! Un vero precedente non informativo (portato al limite) non avrebbe alcun peso. Significa, in effetti, partire da zero e, per usare un'espressione frequentista, lasciare che i dati parlino da soli. L'osservazione fatta da "Clarence" era che il modo frequentista di codificare questa mancanza di informazioni è con l'ipotesi nulla. Non è esattamente lo stesso di un precedente non informativo; è l'approccio frequentista per esprimere la massima ignoranza in modo onesto, uno che non presume ciò che desideri dimostrare.


2
L'ipotesi nulla del frequentista non esprime la massima ignoranza, inizia a supporre che l'ipotesi nulla sia vera e dovremmo procedere con l'ipotesi alternativa solo se le osservazioni sono sufficientemente improbabili sotto H0. Si potrebbe sostenere che il test di ipotesi nulla codifichi alcuni precedenti, ma è decisamente informativo. A mio avviso, il tentativo di interpretare il test delle ipotesi del frequentatore in termini bayesiani è fuorviante e una ricetta per l'errore; non sono risposte alla stessa domanda.
Dikran Marsupial,

@Dikran Marsupial questo è in una certa misura un dibattito senza fine, ma da una prospettiva più frequente non vedo alcun modo di vedere il nulla come "decisamente informativo". In tal caso, il mancato rifiuto del null verrebbe considerato come prova del null (poiché "già" disponiamo di informazioni sul null). Tutti gli approcci dell'IMO sull'inferenza stanno tentando di rispondere alle stesse domande correlate: "Come devono essere interpretati i dati?" e "quanto è forte il caso?"
Matt Asher,

1
Il null stesso non è informativo o non informativo, ma il test delle ipotesi del frequentatore convenzionale è intrinsecamente (e giustamente) distorto verso l'H0 (a meno che non si esegua anche un'analisi di potenza). Questo pregiudizio può essere paragonato a un precedente, ma sarebbe informativo. Semplicemente non è significativo confrontare priori e ipotesi, servono a scopi diversi nell'analisi; nota Bayesian usa anche ipotesi nulle nel test di ipotesi (vedi la mia risposta alla domanda) dove ha lo stesso scopo del test di ipotesi frequentista.
Dikran Marsupial,

3
Per essere chiari, usando l'esempio del farmaco, non iniziamo fingendo l'ignoranza "Bene, forse questo farmaco ha un effetto zero sulle persone", iniziamo assumendo che l'ipotesi nulla sia corretta "Il farmaco ha effetto zero ed è alto alla compagnia farmaceutica di stabilire che ha un effetto dimostrando che i risultati non possono essere adeguatamente spiegati per caso ". L'auto-scetticismo che offre questo approccio è il motivo per cui il "rituale nullo", nonostante i suoi numerosi difetti, ha ancora un valore pratico nella scienza.
Dikran Marsupial,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.