Errore generale di tipo I quando si verificano ripetutamente l'accumulazione di dati


12

Ho una domanda sui metodi sequenziali di gruppo .

Secondo Wikipedia:

In uno studio randomizzato con due gruppi di trattamento, il test sequenziale di gruppo classico viene utilizzato nel modo seguente: Se sono disponibili n soggetti in ciascun gruppo, viene condotta un'analisi intermedia sui 2n soggetti. L'analisi statistica viene eseguita per confrontare i due gruppi e, se viene accettata l'ipotesi alternativa, la sperimentazione viene chiusa. Altrimenti, il processo continua per altri 2n soggetti, con n soggetti per gruppo. L'analisi statistica viene nuovamente eseguita su 4n soggetti. Se l'alternativa viene accettata, il processo viene terminato. Altrimenti, continua con valutazioni periodiche fino a quando non saranno disponibili N set di 2n soggetti. A questo punto viene condotto l'ultimo test statistico e la sperimentazione viene interrotta

Ma testando ripetutamente l'accumulo di dati in questo modo, il livello di errore di tipo I viene gonfiato ...

Se i campioni fossero indipendenti l'uno dall'altro, l'errore generale di tipo I, , sarebbeα

α=1(1α)k

dove è il livello di ciascun test e è il numero di look intermedi.αk

Ma i campioni non sono indipendenti poiché si sovrappongono. Supponendo che le analisi intermedie vengano eseguite con incrementi di informazioni uguali, si può trovare che (diapositiva 6)

inserisci qui la descrizione dell'immagine

Puoi spiegarmi come si ottiene questa tabella?

Risposte:


12

Le seguenti diapositive, attraverso 14, spiegano l'idea. Il punto, come si nota, è che la sequenza delle statistiche è correlata.

Il contesto è un test z con deviazione standard nota. La prima statistica di prova , opportunamente standardizzata, ha una distribuzione normale (0,1) con cdf . Lo stesso la seconda statistica , ma - poiché la prima utilizza un sottoinsieme dei dati utilizzati per la seconda - le due statistiche sono correlate al coefficiente di correlazione . Pertanto ha una distribuzione binormale. La probabilità di un errore di tipo I (secondo l'ipotesi nulla) è uguale alla probabilità che (a) si verifichi un errore di tipo I nel primo test o (b) un errore di tipo I non si verifichi nel primo test ma si verifichi nel secondo test. Siaz1Φz21/2(z1,z2)c=Φ1(10.05/2)essere il valore critico (per un test a due facciate con dimensione nominale = 0,05). Quindi la possibilità di un errore di tipo I dopo due analisi equivale alla possibilità che o e . L'integrazione numerica fornisce il valore 0,0831178 per questa probabilità, concordando con la tabella. I valori successivi nella tabella sono ottenuti con ragionamenti simili (e integrazioni più complicate).α|z1|>c|z1|c|z2|>c

Questo grafico mostra il pdf binormale e la regione di integrazione (superficie solida). PDF binormale, diagramma di superficie 3D


Capito, grazie! La correlazione cor (z1, z2) è difficile da ottenere?
Ocram,

@ Marco, la correlazione è semplice da calcolare perché la statistica del test è così semplice: è una combinazione lineare di variabili normali. (Questo perché supponiamo che la varianza sia nota.) In alternativa, puoi considerare la seconda statistica come una somma di due variabili casuali indipendenti: la prima, , più la modifica creata dai dati aggiuntivi, . In casi più complicati la correlazione potrebbe essere piuttosto difficile da calcolare: questa è una ragione per cui questa situazione un po 'idealizzata viene utilizzata per motivare i test sequenziali! z1z1z2
whuber

Grazie mille. Sì, la correlazione sembra abbastanza facile da calcolare. In realtà, non mi era chiaro che il contesto fosse un confronto tra i mezzi di due normali distribuzioni. Ora è chiaro e rendi tutto molto chiaro anche tu! Grazie!
Ocram,

potresti fornire una formula (o codice R) come calcolarlo per es. n = 400? Lo farei da solo, ma sfortunatamente non so come. E come dovrei modificare la formula se volessi calcolare il tasso di errore complessivo se avessi più confronti (ad esempio confrontando 4 proporzioni) e non fare una correzione come Bonferroni e fare test ripetuti? Potresti aiutarmi con quello?
Andreas,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.