"Intenzione dello sperimentatore" e soglie / valori p


21

Sto leggendo le diapositive "Doing Bayesian Data Analysis" di John Kruschke , ma in realtà ho una domanda sulla sua interpretazione dei test t e / o sull'intero framework di test di significatività dell'ipotesi nulla. Sostiene che i valori di p sono mal definiti perché dipendono dalle intenzioni dell'investigatore.

In particolare, fornisce un esempio (pagine 3-6) di due laboratori che raccolgono set di dati identici confrontando due trattamenti. Un laboratorio si impegna a raccogliere dati da 12 soggetti (6 per condizione), mentre l'altro raccoglie dati per una durata fissa, che a sua volta produce anche 12 soggetti. Secondo le diapositive, il valore critico per differisce tra questi due schemi di raccolta dati: per il primo, ma per il secondo !p < 0,05 t crit = 2,33 t crit = 2,45tp<0.05tcrit=2.33tcrit=2.45

Un post sul blog - che ora non riesco a trovare - ha suggerito che lo scenario a durata fissa ha più gradi di libertà poiché avrebbero potuto raccogliere dati da 11, 13 o qualsiasi altro numero di argomenti, mentre lo scenario a N fisso, da definizione, ha .N=12

Qualcuno potrebbe spiegarmi:

  • Perché il valore critico differirebbe tra queste condizioni?

  • (Supponendo che sia un problema) Come si potrebbe fare per correggere / confrontare gli effetti di diversi criteri di arresto?

So che l'impostazione dei criteri di arresto in base alla significatività (ad esempio, campione fino a ) può gonfiare le possibilità di un errore di tipo I, ma ciò non sembra succedere qui, poiché nessuna delle due regole di arresto dipende dal risultato di le analisi.p<0.05

Risposte:


11

Ecco qualche informazione in più: http://doingbayesiandataanalysis.blogspot.com/2012/07/sampling-distributions-of-t-when.html

Una discussione più completa è fornita qui: http://www.indiana.edu/~kruschke/BEST/ Questo articolo considera i valori p per l'arresto alla soglia N, l'arresto alla durata della soglia e l'arresto alla soglia t.


Wow! Direttamente dalla bocca del cavallo, per così dire ... È sicuramente un'idea interessante che non mi era venuta in mente. Grazie per le informazioni aggiuntive.
Matt Krause,

Volevo aggiungere che questo è discusso a lungo nel libro del Dr. Kruschke (nel Capitolo 11).
Matt Krause,

13

Ho finalmente rintracciato il documento associato alle diapositive: Kruschke (2010) , disponibile anche direttamente dall'autore (tramite CiteSeerX) qui , poiché il diario non è ampiamente diffuso. La spiegazione è un po 'prosaica, ma non sono ancora sicuro di acquistarla.

Nel caso della N fissa, il valore critico viene calcolato come segue: i campioni vengono estratti casualmente dalla (stessa) popolazione e viene calcolato un valore . Questo processo viene ripetuto più volte per creare una distribuzione nulla. Infine, è impostato per essere il 95 ° percentile di quella distribuzione.2 N t t c r i tt2Nttcriot

Per il caso a durata fissa, assume che i soggetti arrivino ad un tasso medio . La distribuzione nulla viene costruita ripetendo due passaggi. Nella prima fase, il numero di soggetti per ciascuna condizione e è tratto da una distribuzione di possesso con parametro . Successivamente, per calcolare un valore vengono utilizzati i sorteggi e casuali della popolazione . Questo si ripete molte volte e è impostato per essere il 95 ° percentile di quella distribuzione.N 1 N 2 λ N 1 N 2 t t c r i tλN1N2λN1N2ttcriot

Questo mi sembra un po 'sfacciato ... A quanto ho capito, non esiste una sola distribuzione ; invece è una famiglia di distribuzioni, con una forma in parte determinata dal parametro gradi di libertà. Per la condizione fissa , ci sono soggetti per gruppo e il valore appropriato per un test t non accoppiato è quello con gradi di libertà, presumibilmente ciò che riproduce la sua simulazione. N N t 2 N - 2tNNt2N-2

t λ = N 2 N - N t ν = 1 ν = 5ttλ=N2N-Ntν=1ν=5t

In sintesi:

  • tcriot
  • t
  • Non sono convinto che questo sia effettivamente un problema, ma sarei felice di leggere / votare / accettare le risposte se qualcuno la pensa diversamente.

Perché sei in grado di rispondere alla tua domanda e dare un segno di spunta? Non sembra che dovresti essere in grado di darti delle punte!
Michael R. Chernick,

5
Non c'è niente di sbagliato a rispondere alla sua stessa domanda , Michael.
chl

@MichaelChernick, credo che non avrai nessun rappresentante se accetti la tua risposta. All'epoca, mi sembrava la cosa giusta da fare, dato che nelle due settimane successive avevo più o meno rintracciato la risposta, ma ho cambiato la mia accettazione alla risposta di John K. Kruschke poiché è chiaramente l'autorità da solo diapositive :-)
Matt Krause,

Grazie interessanti. Ma non vedo perché si dovrebbe controllare la propria risposta in qualsiasi momento, anche se sembra essere corretta e la migliore. Abbiamo stabilito che il controllo della tua risposta non ti dà punti rep.
Michael R. Chernick,

3
Dal momento che contrassegnare una risposta come accettata non ha altro scopo se non quello di indicare una soluzione corretta (per i futuri visitatori), soprattutto dove non è stato proposto nessun altro, non vedo alcun problema. Personalmente, ho votato a fondo questa risposta molto tempo fa, perché apprezzo che l'OP ci consenta di beneficiare della sua stessa ricerca. E mi dispiace davvero non poter dare un voto aggiuntivo per il semplice fatto di seguire questa discussione e aggiornare la sua decisione. PS "Abbiamo stabilito ..." si riferisce a Perché è possibile assegnarsi punti reputazione? .
chl
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.