Test post hoc in ANCOVA


13

Domanda: Qual è un buon metodo per condurre test post hoc delle differenze tra i mezzi di gruppo dopo aver aggiustato l'effetto di una covariata?

Esempio prototipico:

  • Quattro gruppi, 30 partecipanti per gruppo (ad esempio, quattro diverse popolazioni di psicologia clinica)
  • La variabile dipendente è numerica (ad esempio, i punteggi dell'intelligence)
  • La covariata è numerica (ad es. Indice dello stato socioeconomico)
  • Le domande di ricerca riguardano se qualsiasi coppia di gruppi è significativamente diversa sulla variabile dipendente dopo il controllo per la covariata

Domande correlate :

  • Qual è il metodo preferito?
  • Quali implementazioni sono disponibili in R?
  • Ci sono riferimenti generali su come una covariata cambia le procedure per condurre test post hoc?

Potresti voler leggere anche qui. stackoverflow.com/questions/23628323/…
James Holland,

Risposte:


13

Test multipli a seguito di ANCOVA, o più in generale di qualsiasi GLM, ma i confronti si concentrano ora sul gruppo / trattamento adeguati o sui mezzi marginali (cioè quali sarebbero i punteggi se i gruppi non differissero sulla covariata di interesse). Per quanto ne so, vengono utilizzati i test Tukey HSD e Scheffé. Entrambi sono piuttosto prudenti e tenderanno a limitare il tasso di errore di tipo I. Quest'ultimo è preferito in caso di dimensioni del campione disuguali in ciascun gruppo. Mi sembra di ricordare che alcune persone usano anche la correzione di Sidak su specifici contrasti (quando ovviamente è di interesse) in quanto è meno conservativa della correzione di Bonferroni.

Tali test sono prontamente disponibili nel multcomppacchetto R (vedi ?glht). La vignetta di accompagnamento include un esempio di utilizzo nel caso di un modello lineare semplice (sezione 2), ma può essere esteso a qualsiasi altra forma di modello. Altri esempi possono essere trovati nei HHpacchetti (vedi ?MMC). Diverse procedure MCP e di ricampionamento (raccomandate per forti inferenze, ma si basa su un approccio diverso alla correzione per l'inflazione del tasso di errore di tipo I) sono disponibili anche nel multtestpacchetto, tramite Bioconductor , vedere refs (3–4). Il riferimento definitivo al confronto multiplo è il libro degli stessi autori: Dudoit, S. e van der Laan, MJ, Multiple Testing Procedures with Applications to Genomics (Springer, 2008).

Il riferimento 2 ha spiegato la differenza tra MCP nel caso generale (ANOVA, lavorando con mezzi non aggiustati) rispetto a ANCOVA. Ci sono anche diversi articoli che non ricordo davvero, ma li guarderò.

Altri riferimenti utili:

  1. Westfall, PH (1997). Test multipli di contrasti generali usando contrapposizioni e correlazioni logiche. JASA 92 : 299-306.
  2. Westfall, PH and Young, SS (1993) Test multipli basati sul ricampionamento, esempi e metodi per la regolazione del valore p . John Wiley and Sons: New York.
  3. Pollard, KS, Dudoit, S. e van der Laan, MJ (2004). Procedure di test multipli: pacchetto R multtest e applicazioni alla genomica .
  4. Taylor, SL Lang, DT e Pollard, KS (2007). Miglioramenti al pacchetto di test multipli multtest . R Notizie 7 (3) : 52-55.
  5. Bretz, F., Genz, A. e Hothorn, LA (2001). Sulla disponibilità numerica di più procedure di confronto. Diario biometrico , 43 (5) : 645–656.
  6. Hothorn, T., Bretz, F. e Westfall, P. (2008). Inferenza simultanea in modelli parametrici generali . Dipartimento di Statistica: Rapporti tecnici, n. 19.

I primi due sono indicati in SAS PROC relativo a MCP.


3

Questa è una domanda interessante Penso che bisogna stare molto attenti a questo, poiché la maggior parte dei software che fanno un confronto post hoc dopo ANCOVA lo fanno MA con mezzi non adeguati.

Il test Bryan Paulson Tukey (BPT) è raccomandato per il confronto a coppie sui mezzi ADJUSTED, un'altra procedura potrebbe essere il test condizionale Tukey Kramer.


2

Combinando metodi semplici a cui puoi accedere facilmente da R e principi generali potresti usare l'HSD di Tukey in modo abbastanza semplice. Il termine di errore dell'ANCOVA fornirà il termine di errore per gli intervalli di confidenza.

Nel codice R sarebbe ...

#set up some data for an ANCOVA
n <- 30; k <- 4
y <- rnorm(n*k)
a <- factor(rep(1:k, n))
cov <- y + rnorm(n*k)

#the model
m <- aov(y ~ cov + a)

#the test
TukeyHSD(m)

(ignora l'errore nel risultato, significa solo che la covariata non è stata valutata, che è quello che vuoi)

Ciò fornisce intervalli di confidenza più ristretti di quelli che si ottengono se si esegue il modello senza il cov ... come previsto.

Qualsiasi tecnica post hoc che si basa sui residui del modello per la varianza dell'errore potrebbe essere facilmente utilizzata.


0

Perché ti stai dando così tanti problemi e ti confondi?

Puoi consultare Andy Field's Discovering Statistics utilizzando SPSS (3a edizione) pagg. 401-404.

Usando la funzione dei contrasti o confrontando l'opzione degli effetti principali, puoi facilmente fare il post hoc su mezzi adeguati dopo aver preso in considerazione la covariata.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.