Come visualizzare le barre di errore per esperimenti crossover (accoppiati)


19

Il seguente scenario è diventato la maggior parte delle FAQ nel trio di investigatore (I), revisore / editore (R, non correlato a CRAN) e me (M) come creatore di trama. Possiamo presumere che (R) sia il tipico revisore medico di big boss, che sa solo che ogni trama deve avere una barra di errore, altrimenti è sbagliato. Quando è coinvolto un revisore statistico, i problemi sono molto meno critici.

Scenario

In un tipico studio incrociato farmacologico, due farmaci A e B sono testati per il loro effetto sul livello di glucosio. Ogni paziente viene testato due volte in ordine casuale e supponendo che non vengano riportati. L'endpoint primario è la differenza tra glucosio (BA) e supponiamo che un t-test associato sia adeguato.

(I) vuole un diagramma che mostri i livelli assoluti di glucosio in entrambi i casi. Teme il desiderio di (R) di barre di errore e chiede errori standard nei grafici a barre. Non iniziamo la guerra dei grafici a barre qui ._)

grafici a barre e glucosio SE per due trattamenti

(I): Non può essere vero. Le barre si sovrappongono e abbiamo p = 0,03? Non è quello che ho imparato al liceo.

(M): abbiamo un design abbinato qui. Le barre di errore richieste sono totalmente irrilevanti, ciò che conta è il SE / CI delle differenze accoppiate, che non sono mostrate nel grafico. Se avessi una scelta e non ci fossero troppi dati, preferirei la seguente trama

Le linee unite mostrano l'associazione, punteggia i valori originali

Aggiunto 1: questo è il diagramma delle coordinate parallele menzionato in diverse risposte

(M): le linee mostrano l'accoppiamento e la maggior parte delle linee salgono, e questa è l'impressione giusta, perché la pendenza è ciò che conta (ok, questo è categorico, ma comunque).

(I): Quell'immagine è confusa. Nessuno lo capisce e non ha barre di errore (R è in agguato).

(M): potremmo anche aggiungere un altro grafico che mostra l'intervallo di confidenza pertinente della differenza. La distanza dalla linea zero dà un'impressione della dimensione dell'effetto.

(I): Nessuno lo fa

(R): E spreca alberi preziosi

(M): (come un buon tedesco): Sì, viene preso il punto sugli alberi. Ma lo uso comunque (e non lo faccio mai pubblicare) quando abbiamo più trattamenti e più contrasti.

intervallo di confidenza della differenza

Qualche suggerimento ? Il codice R è di seguito, se si desidera creare una trama.

# Graphics for Crossover experiments
library(ggplot2)
library(plyr)
theme_set(theme_bw()+theme(panel.margin=grid::unit(0,"lines")))
n = 20
effect = 5 
set.seed(4711)
glu0 = rnorm(n,120,30)
glu1 = glu0 + rnorm(n,effect,7)
dt = data.frame(patient = rep(paste0("P",10:(9+n))),              
                treatment = rep(c("A","B"), each=n),glucose = c(glu0,glu1))

dt1 = ddply(dt,.(treatment), function(x){
  data.frame(glucose = mean(x$glucose), se = sqrt(var(x$glucose)/nrow(x)) )})

tt = t.test(glucose~treatment,paired=TRUE,data=dt,conf.int=TRUE)
dt2 = data.frame(diff = -tt$estimate,low=-tt$conf.int[2], up=-tt$conf.int[1])
p = paste("p =",signif(tt$p.value,2))

png(height=300,width=300)
ggplot(dt1, aes(x=treatment, y=glucose, fill=treatment))+      
  geom_bar(stat="identity")+  
  geom_errorbar(aes(ymin=glucose-se, ymax=glucose+se),size=1., width=0.3)+
  geom_text(aes(1.5,150),label=p,size=6)

ggplot(dt,aes(x=treatment,y=glucose, group=patient))+ylim(0,190)+
  geom_line()+geom_point(size=4.5)+
  geom_text(aes(1.5,60),label=p,size=6)

ggplot(dt2,aes(x="",y=diff))+
  geom_errorbar(aes(ymin=low,ymax=up),size=1.5,width=0.2)+ 
  geom_text(aes(1,-0.8),label=p,size=6)+
  ylab("95% CI of difference glucose B-A")+  ylim(-10,10)+
  theme(panel.border=element_blank(), panel.grid.major.x=element_blank(),
         panel.grid.major.y=element_line(size=1,colour="grey88"))

dev.off()

Oh mio Dio @ dieter-menne, ottima domanda! Dipende molto dal tipo di giornale a cui si invia l'articolo. Starò lontano dalle guerre dei grafici, ma adoro i grafici 2 e 3: così tante informazioni in così poco spazio.
doug.numbers,

4
Masson and Loftus (2003) è spesso un riferimento. Mostrano grafici di esempio in cui riquadri dell'IC della differenza in un secondo pannello dello stesso grafico. Se questo renderà felici tutti nel circo, non lo so (mi sento per te!)
Andy W

Grazie, @AndyW, per il riferimento. È al punto, ma ha un problema: viene dalla psicologia. Ci sono molti altri buoni articoli in materia di psicologi che hanno un background statistico molto migliore rispetto ai revisori medici. Vorrei poter trovare una guida del diario di alto rango sull'argomento, questa è l'unica spada affilata che potrei maneggiare.
Dieter Menne,

Risposte:


17

Hai perfettamente ragione nel ritenere che le barre di errore che rappresentano l'errore standard della media siano totalmente inadeguate per i progetti all'interno del soggetto. Tuttavia, la questione della sovrapposizione di barre di errore e significato è ancora un altro argomento, a cui tornerò alla fine di questo elenco di riferimenti commentati.

Esiste una ricca letteratura psicologica sugli intervalli di confidenza all'interno dell'individuo o sulle barre di errore che fanno esattamente quello che vuoi. Il lavoro di riferimento è chiaramente:

Loftus, GR e Masson, MEJ (1994). Utilizzando intervalli di confidenza nei disegni entro i soggetti . Psychonomic Bulletin & Review , 1 (4), 476–490. doi: 10,3758 / BF03210951

Tuttavia, il loro problema è che usano lo stesso termine di errore per tutti i livelli di un fattore all'interno del soggetto. Questo non sembra essere un grosso problema per il tuo caso (2 livelli). Ma ci sono approcci più moderni per risolvere questo problema. Soprattutto:

Franz, V., & Loftus, G. (2012). Errori standard e intervalli di confidenza nei progetti all'interno di soggetti: Generalizzare Loftus e Masson (1994) ed evitare i pregiudizi di conti alternativi . Bollettino psicologico e revisione , 1–10. doi: 10,3758 / s13423-012-0230-1

Baguley, T. (2011). Calcolo e rappresentazione grafica degli intervalli di confidenza all'interno del soggetto per ANOVA. Metodi di ricerca comportamentale . doi: 10.3758 / s13428-011-0123-7 [ può essere trovato qui ]

Ulteriori riferimenti possono essere trovati negli ultimi due articoli (che ritengo valga la pena di leggere entrambi).


In che modo i ricercatori interpretano gli EC? Cattivo secondo il seguente documento:

Belia, S., Fidler, F., Williams, J., & Cumming, G. (2005). I ricercatori fraintendono gli intervalli di confidenza e le barre di errore standard . Metodi psicologici , 10 (4), 389–396. DOI: 10,1037 / 1082-989X.10.4.389

Come dovremmo interpretare gli IC sovrapposti e non sovrapposti?

Cumming, G., & Finch, S. (2005). Inference by Eye: intervalli di confidenza e come leggere le immagini dei dati . Psicologo americano , 60 (2), 170-180. DOI: 10,1037 / 0003-066X.60.2.170


Un ultimo pensiero (anche se questo non è rilevante per il tuo caso): se hai un disegno a trama divisa (cioè, fattori all'interno e tra soggetti) in una trama, puoi dimenticare le barre di errore tutte insieme. Vorrei (umilmente) ha raccomandato la mia raw.means.plotfunzione nel pacchetto di R plotrix.


2
Elenco di riferimento molto utile. Cumming ha riunito molte delle sue idee in amazon.com/Understanding-New-Statistics-Meta-Analysis-ebook/dp/… (Qualunque cosa tu voglia dire sull'espressione "le nuove statistiche", probabilmente sono d'accordo.)
Nick Cox,


@amoeba La carta Baguley che cito usa la tecnica della carta Morey.
Henrik

10

La domanda non sembra riguardare le barre di errore, ma piuttosto i modi migliori per tracciare dati accoppiati.

In sostanza, le barre di errore qui sono al massimo un modo per riassumere l'incertezza: non lo fanno e non possono necessariamente dire molto su qualsiasi struttura fine nei dati.

Grafici di coordinate parallele - a volte chiamati grafici di profilo, un termine che significa cose diverse in campi diversi - sono stati menzionati nella domanda. I grafici a dispersione di base sono già stati suggeriti da @Ray Koopman.

AB(A+B)/2A+B

Un'altra fonte per questo complotto è Neyman, J., Scott, EL e Shane, CD 1953. Sulla distribuzione spaziale delle galassie: un modello specifico. Diario astrofisico 117: 92–133.

In termini generali, tali trame assomigliano all'idea di tracciare i residui rispetto agli adattati, resi popolari anche da Tukey e suo cognato Anscombe al quadrato.

AB=0A=BAB

Un disegno trascurato è il diagramma a linee parallele di McNeil, DR 1992. Sulla rappresentazione grafica dei dati associati. Statistico americano 46: 307–310. Questo è anche discusso nei due riferimenti seguenti.

Sono presenti recensioni collegate a stata, con diversi riferimenti

2004, Accordo grafico e disaccordo. Stata Journal 4: 329-349.

.pdf accessibile a http://www.stata-journal.com/sjpdf.html?articlenum=gr0005

Grafici associati, paralleli o di profilo per modifiche, correlazioni e altri confronti. Stata Journal 9: 621-639.

.pdf accessibile a http://www.stata-journal.com/sjpdf.html?articlenum=gr0041

Gli utenti non Stata dovrebbero essere in grado di saltare e canticchiare il codice Stata mentre studiano come implementare i grafici nel proprio software preferito.

AB


4

Prova un diagramma a dispersione dei singoli punti (A, B). La maggior parte di essi dovrebbe trovarsi su un solo lato della diagonale (la linea A = B). Esistono due analoghi di barre di errore. Quello convenzionale, equivalente a un CI per la differenza media, sarebbe una banda di confidenza per la differenza media. La banda sarebbe la regione tra due linee, entrambe parallele alla diagonale. Un test a T associato sarebbe significativo se e solo se entrambi i bordi della banda fossero sullo stesso lato della diagonale.

Un analogo più conservativo della barra di errore sarebbe un'ellisse di confidenza per il centroide.


1
cmethodBcmethodUN

No, cl. - :) La chimica clinica è troppo sofisticata. Potrebbe essere che tu abbia aggiunto qualche riferimento in "lì"; Non sono sicuro di quale carta stia parlando.
Dieter Menne,

4

Riepilogo preliminare:

Masson / Loftus è molto esaustivo e non è una lettura facile da dare ai miei colleghi medici che non accetterebbero qualcosa di simile a una "interazione". Hanno anche alcuni suggerimenti per confronti multipli, che mostrano che gli intervalli di confidenza a coppie sono difficili da illustrare quando non si desidera semplificare pesantemente.

Masson Loftus

Non mi piace questo stile: le barre con barre di errore sembrano Excelish dello scorso millennio. Tuttavia, usano anche uno stile leggermente più elegante:

Masson Loftus senza bar

Cumming / Finch e Belia et al. sono letture obbligatorie. La prima è la scelta perfetta per dare al tuo amico che rabbrividisce quando vede la parola interazione . Ho ordinato il libro di Cumming dopo aver letto quell'articolo. Il secondo mostra un test che implementerò a Shiny per la prossima riunione di investigatore medico.

Cumming / Finch

Mi piace questa trama, anche se esiste un secondo asse che non avevo mai usato prima; controlla il contributo di Henrik e altri su StackOverflow per un metodo grafico R-base per ottenerlo. Preferirei mettere il secondo asse a sinistra della differenza per chiarire assolutamente che i valori sono cambiati e forse aggiungere un asse di valore p.

Qualcuno della frazione reticolare / ggplot sta sparando? Tutte le soluzioni fornite sono grafiche di base e non pannellabili / sfaccettabili.

Tuttavia: nota che commenti e articoli provengono principalmente dal dipartimento di psicologia (e @cbeleites dalla chimica hardcore). Sarebbe bello ricevere commenti dai revisori delle riviste mediche.


0

Perché non tracciare semplicemente la differenza * per ciascun paziente? È quindi possibile utilizzare un istogramma, un diagramma a riquadri o un diagramma delle probabilità normale e sovrapporre un intervallo di confidenza del 95% per la differenza.

  • In alcuni scenari potrebbe essere la differenza dei logaritmi. Vedi, per esempio, Patterson & Jones, "Bioequivalenza e statistica in farmacologia clinica", Chapman, 2006.

Perchè no? Potrebbe fornire informazioni valide, ma i grafici con singoli punti o coppie non sono molto popolari nella ricerca medica. Ecco perché la trama parallela (che fornisce maggiori informazioni) è così impopolare. I ricercatori medici vogliono medie e "intervalli normali" (qualunque cosa sia).
Dieter Menne,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.