Significato in linguaggio semplice di test "dipendenti" e "indipendenti" nella letteratura sui confronti multipli?


18

Sia nella letteratura sulla percentuale di errori a livello familiare (FWER) che sulla percentuale di scoperta falsa (FDR), si dice che particolari metodi di controllo della FWER o della FDR siano appropriati per test dipendenti o indipendenti. Ad esempio, nel documento del 1979 "Una semplice procedura di prova multipla in sequenza sequenziale", Holm ha scritto per contrastare il suo metodo Šidák intensivo rispetto al suo metodo di controllo Bonferroni intensificato:

La stessa semplicità computazionale si ottiene quando le statistiche dei test sono indipendenti .

In "Controlling the False Discovery Rate" di Benjamini e Hochberg (1995), gli autori scrivono:

Teorema 1. Per statistiche di test indipendenti e per qualsiasi configurazione di ipotesi nulle false, la procedura sopra descritta controlla l'FDR in .q*

Più tardi, nel 2001, Benjamini e Yekutieli scrivono:

1.3. Il problema . Quando si tenta di utilizzare l'approccio FDR in pratica, si incontrano più frequentemente statistiche di test dipendenti rispetto a quelle indipendenti , l'esempio di endpoint multipli di cui sopra è un caso emblematico.

Quali significati particolari di dipendente indipendente dipendono da questi autori? Sarei felice per le definizioni formali di ciò che rende i test dipendenti o indipendenti l'uno dall'altro se accompagnano una spiegazione del linguaggio semplice.

Riesco a pensare a diversi significati possibili, ma non riesco proprio a capire quali, eventualmente, potrebbero essere:

  • "Dipendente" significa test multivariati (ovvero molte variabili dipendenti con predittori uguali o simili); indipendente significa test univariati (cioè molte variabili indipendenti, una variabile dipendente).

  • "Dipendente" indica test basati su soggetti accoppiati / abbinati (ad es . Test t accoppiato , misure ripetute ANOVA, ecc.); "indipendente" significa un disegno di studio di campioni non accoppiati / indipendenti.

  • "Dipendente" significa che la probabilità che un test venga rifiutato è correlata alla probabilità che un altro test venga rifiutato e "dipendenza positiva" significa che questa correlazione è positiva; "indipendente" significa che le probabilità di rifiuto non sono correlate.

Riferimenti
Benjamini, Y. e Hochberg, Y. (1995). Controllo del falso tasso di scoperta: un approccio pratico e potente ai test multipli . Giornale della Royal Statistical Society. Serie B (metodologica) , 57 (1): 289–300.

Benjamini, Y. e Yekutieli, D. (2001). Il controllo del tasso di rilevamento falso in più test in dipendenza . Annals of Statistics , 29 (4): 1165-1188.

Holm, S. (1979). Una semplice procedura di prova multipla sequenzialmente rifiutativa . Scandinavian Journal of Statistics , 6 (65-70): 1979.


1
Una statistica di prova è una variabile casuale. "Indipendente" in questo contesto ha esattamente lo stesso significato che ha per qualsiasi insieme di variabili casuali.
whuber

Grazie @whuber ogni possibilità che vorresti amplificare in una risposta? :)
Alexis,

Risposte:


13

1/201/201/2020 diversi test.

20

201/2020(10.05)200.3610.36=0.64

2020

(ANOVA gestisce questo problema con il suo F-test generale. È una specie di confronto "per dominarli tutti": non ci fideremo del confronto da gruppo a gruppo a meno che prima questo F-test non sia significativo.)

(p1,p2,...,pn)nndi loro in un'unica decisione. Altrimenti, il meglio che di solito possiamo fare è fare affidamento su limiti approssimativi (che è la base della correzione di Bonferroni, per esempio).

Le distribuzioni congiunte di variabili casuali indipendenti sono facili da calcolare. La letteratura distingue quindi tra questa situazione e il caso di non indipendenza.

Di conseguenza, il significato corretto di "indipendente" tra virgolette è nel solito senso statistico di variabili casuali indipendenti.


n(X1,...,Xm)μμ=0p1μ=1p2(p1,p2)


+1 Grazie, whuber! Per l'esempio ANOVA, sarebbe il caso che qualsiasi confronto a coppie che segue ANOVA in cui tutte le possibili coppie sono testate sarebbe "dipendente", o solo il caso in cui un gruppo viene confrontato con una selezione di altri? (Penso che il primo, ma voglio essere sicuro).
Alexis,

2
In ANOVA, la varianza dei residui è stimata da tutti i dati. Pertanto, ogni due confronti dipenderà (leggermente), anche solo per tale motivo, anche quando i confronti non hanno gruppi in comune. Quando i confronti hanno gruppi in comune (come "A" vs "C" e "B" vs "C"), la dipendenza è più ovvia e pronunciata.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.