Cosa significa rendere la dimensione del campione una variabile casuale?


18

Frank Harrell ha aperto un blog ( Statistical Thinking) . Nel suo primo incarico , elenca alcune caratteristiche chiave della sua filosofia statistica. Tra gli altri articoli, include:

  • Rendi la dimensione del campione una variabile casuale quando possibile
  1. Cosa significa "rendere la dimensione del campione una variabile casuale"?
  2. Quali sono i vantaggi di farlo? Perché potrebbe essere preferibile?

Nell'analisi sequenziale il tempo di occorrenza di un evento viene trattato come una variabile casuale. Questa è anche la vera dimensione del campione.
Michael R. Chernick il

@RichardHardy, questo dovrebbe essere discusso su Cross Validated Meta . Ho creato il tag b / c che non avevamo 1 e ci sono molte domande su ACF, ecc. Potremmo sempre renderlo un sinonimo.
gung - Ripristina Monica

Risposte:


13

Non intendo usare modelli vicini al processo di raccolta dei dati, ma piuttosto fare un monitoraggio bayesiano continuo delle probabilità posteriori, che non richiede penalità per la molteplicità. Invece di calcolare una dimensione del campione di destinazione arbitraria, preferirei calcolare una dimensione del campione massima possibile (per l'approvazione del budget) e altrimenti interrompere "quando otteniamo la risposta" come di solito fatto con buoni risultati in fisica. Dirò di più a riguardo nel mio blog http://fharrell.com qualche giorno prima.


1
Cosa significa concretamente "quando otteniamo la risposta"? Penserei che condurre uno studio fino a quando non si ottenga un risultato che ti è piaciuto (ad esempio, un intervallo credibile del 95% non include 0) sarebbe corrotto in un contesto bayesiano come in uno frequentista.
gung - Ripristina Monica

1
@gung affatto. L'inferenza bayesiana è completamente indipendente dalla regola di arresto. È facile simulare la calibrazione delle probabilità posteriori al momento dell'arresto anticipato, dimostrando che sono esattamente corrette. Questa è una delle incredibili differenze con il mondo frequentista. In generale, le probabilità in avanti sono senza contesto e le probabilità all'indietro dipendono da come ci sei arrivato. Quindi mi fermerei quando la probabilità posteriore dell'effetto> 0 supera un numero come 0,95 o quando l'intervallo credibile ha larghezza <un numero specificato.
Frank Harrell,

1
La tua risposta al commento di @gung mi sembra far sorgere la domanda: alcuni lettori potrebbero ritenere che se l'inferenza bayesiana consenta davvero di "assaggiare una conclusione scontata", tanto peggio per l'inferenza bayesiana. (Li riferirei ai riferimenti nel terzo paragrafo qui .) In attesa del tuo prossimo post sul blog!
Scortchi - Ripristina Monica

Il campionamento a una conclusione errata scontata si verifica solo se il precedente utilizzato dallo statistico è in conflitto con il precedente utilizzato dal revisore. Ad esempio, se il revisore pone una massa di probabilità sul valore nullo (ovvero, il priore ha uno stato di assorbimento) e il modello utilizzato non pone particolare enfasi sul valore nullo, l'analisi può indicare l'arresto per un effetto positivo, ma il revisore afferma che esiste prove insufficienti per un effetto. Se simuli studi con un certo precedente e analizzi usando lo stesso precedente, i probi posteriori sono perfettamente calibrati e anche i mezzi posteriori sono perfetti.
Frank Harrell,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.