L'analisi di potenza è necessaria nelle statistiche bayesiane?


19

Ultimamente ho fatto ricerche sulla versione bayesiana delle statistiche classiche. Dopo aver letto del fattore Bayes, mi sono lasciato interrogare se l'analisi della potenza è una necessità in questa visione delle statistiche. Il motivo principale per cui mi chiedo questo è che il fattore Bayes sembra davvero essere un rapporto di verosimiglianza. Una volta che è come 25: 1 sembra che posso chiamarlo una notte.

Sono lontano? Qualche altra lettura che posso fare per saperne di più? Attualmente sto leggendo questo libro: Introduzione alla statistica bayesiana , di WM Bolstad (Wiley-Interscience; 2a edizione, 2007).



Risposte:


10

La potenza è circa la probabilità a lungo termine di p <0,05 (alfa) in studi futuri. A Bayes le prove dello studio A alimentano i priori per lo studio B, ecc., Lungo la linea. Pertanto, il potere come definito nelle statistiche frequentiste non esiste davvero.


12
Una visione meno limitata del potere lo vede come un'espressione della curva di rischio per una funzione di perdita 0-1. Un'analisi bayesiana integra tale rischio rispetto alla probabilità precedente. Tuttavia, buone analisi bayesiane considerano la sensibilità dei loro risultati alla scelta della distribuzione precedente. Ciò sembrerebbe riportarci di nuovo nel dominio dell'analisi del potere. Anche se potrebbe non avere quel nome e verrebbe calcolato in modo diverso, lo scopo sarebbe lo stesso: determinare l' ampiezza di un campione per essere ragionevolmente sicuro di raggiungere gli obiettivi dello studio.
whuber

2
Questo è un ottimo punto Whuber. Tuttavia, questa non è l'unica ragione per i calcoli della potenza e molti bayesiani sostengono che non è necessario perché non è necessario determinare N in anticipo (un errore).
John,

5
N

2
Non mi è venuta l'idea, ci sono un certo numero di articoli in cui i bayesiani sostengono che è possibile aggiungere argomenti fino a quando non si hanno abbastanza prove sufficienti per prendere una decisione al contrario dei test per i frequentatori in cui tali test e le procedure di aggiunta non funzionano. Potrei cercare un riferimento suppongo. In particolare, ciò si presenta proponendo come analizzare i dati negli studi clinici.
John,

8
N

14

È possibile eseguire test di ipotesi con statistiche bayesiane. Ad esempio, è possibile concludere che un effetto è maggiore di zero se più del 95% della densità posteriore è maggiore di zero. In alternativa, è possibile utilizzare una qualche forma di decisione binaria basata sui fattori Bayes.

Una volta stabilito un tale sistema decisionale, è possibile valutare il potere statistico ipotizzando un dato processo di generazione dei dati e la dimensione del campione. Si può prontamente valutare questo in un determinato contesto usando la simulazione.

Detto questo, un approccio bayesiano si concentra spesso più sull'intervallo di credibilità che sulla stima puntuale e sul grado di convinzione piuttosto che su una decisione binaria. Usando questo approccio più continuo all'inferenza, potresti invece valutare altri effetti sull'inferenza del tuo progetto. In particolare, potresti voler valutare la dimensione prevista dell'intervallo di credibilità per un dato processo di generazione dei dati e la dimensione del campione.


3

Questo problema porta a molti fraintendimenti perché le persone usano le statistiche bayesiane per porre domande frequenti. Ad esempio, le persone vogliono determinare se la variante B è migliore della variante A. Possono rispondere a questa domanda con le statistiche bayesiane determinando se l'intervallo di densità più alta del 95% della differenza tra queste due distribuzioni posteriori (BA) è maggiore di 0 o a regione di significato pratico intorno a 0. Se usi le statistiche bayesiane per rispondere alle domande dei frequentisti, tuttavia, puoi comunque commettere errori da frequentista: tipo I (falsi positivi; opposti - B in realtà non è migliore) e tipo II (mancato; mancata realizzazione che B è veramente migliore).

Il punto di un'analisi di potenza è ridurre gli errori di tipo II (ad esempio avere almeno l'80% di probabilità di trovare un effetto se esiste). Un'analisi di potenza dovrebbe essere usata anche quando si usano le statistiche bayesiane per porre domande frequenti come quella sopra.

Se non usi un'analisi di potenza e poi dai una sbirciatina ripetutamente ai tuoi dati mentre li raccogli e poi ti fermi solo quando trovi una differenza significativa, allora commetterai più errori di tipo I (falsi allarmi) di quanto ti aspetti - come se avessi utilizzato statistiche frequentiste.

check-out:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

Nota: alcuni approcci bayesiani possono ridurre, ma non eliminare, la probabilità di commettere un errore di tipo I (ad esempio, un precedente informativo adeguato).


0

La necessità di un'analisi di potenza in una sperimentazione clinica, ad esempio, è quella di essere in grado di calcolare / stimare quanti partecipanti reclutare per avere la possibilità di trovare un effetto terapeutico (di una determinata dimensione minima) se esiste. Non è possibile reclutare un numero infinito di pazienti, in primo luogo a causa di vincoli temporali e in secondo luogo a causa di vincoli di costo.

Quindi, immagina di adottare un approccio bayesiano per detto studio clinico. Sebbene in teoria siano possibili priori piatti, la sensibilità al priore è consigliabile comunque poiché, sfortunatamente, è disponibile più di un priore piatto (il che è strano ora sto pensando, poiché in realtà dovrebbe esserci solo un modo per esprimere la totale incertezza).

Quindi, immagina che, inoltre, facciamo un'analisi di sensibilità (il modello e non solo il precedente sarebbe anche sotto esame qui). Ciò implica la simulazione da un modello plausibile per "la verità". Nelle statistiche classiche / frequentiste, ci sono quattro candidati per "la verità" qui: H0, mu = 0; H1, mu! = 0 dove si osservano o con errore (come nel nostro mondo reale) o senza errore (come nel mondo reale non osservabile). Nelle statistiche bayesiane, ci sono due candidati per "la verità" qui: mu è una variabile casuale (come nel mondo reale non osservabile); mu è una variabile casuale (come nel nostro mondo reale osservabile, dal punto di vista di un individuo incerto).

Quindi dipende davvero da chi stai cercando di convincere A) dal processo e B) dall'analisi della sensibilità. Se non fosse la stessa persona, sarebbe abbastanza strano.

Ciò che è effettivamente in questione è un consenso su ciò che è la verità e su ciò che prova prove tangibili. La base condivisa è che nel nostro vero mondo osservabile sono osservabili le distribuzioni di probabilità di firma che hanno in qualche modo evidentemente qualche verità matematica di fondo che sembra essere così per caso, o è in base alla progettazione. Mi fermerò qui perché questa non è una pagina di arti, ma piuttosto una pagina di scienza, o questa è la mia comprensione.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.