Come visualizzare due T-test indipendenti?


11

Quali sono i modi più accettati per visualizzare i risultati di un test t indipendente a due campioni? Una tabella numerica è più spesso utilizzata o una sorta di trama? L'obiettivo è che un osservatore occasionale guardi la figura e veda immediatamente che provengono probabilmente da due diverse popolazioni.


"Accettato" da chi, in quale contesto? "Più spesso usato" dove?
Glen_b

Risposte:


18

Vale la pena essere chiari sullo scopo della trama. In generale, esistono due diversi tipi di obiettivi: è possibile creare grafici per valutare autonomamente le ipotesi che si stanno formando e guidare il processo di analisi dei dati, oppure è possibile creare grafici per comunicare un risultato ad altri. Questi non sono gli stessi; ad esempio, molti spettatori / lettori della trama / analisi potrebbero essere statisticamente poco sofisticati e potrebbero non avere familiarità con l'idea di, diciamo, uguale varianza e il suo ruolo in un test t. Vuoi che la tua trama trasmetta le informazioni importanti sui tuoi dati anche ai consumatori come loro. Stanno implicitamente confidando che tu abbia fatto le cose correttamente. Dalla configurazione della tua domanda, ho capito che stai cercando quest'ultimo tipo.

Realisticamente, il più comune e trama accettato per comunicare i risultati di un test t 1 ad altri (annullamento se è effettivamente il più appropriato) è un grafico a barre di mezzi con barre di errore standard. Ciò corrisponde molto bene al test t in quanto un test t confronta due mezzi usando i loro errori standard. Quando si hanno due gruppi indipendenti, questo produrrà un quadro intuitivo, anche per quelli statisticamente poco sofisticati, e le persone (disponibili per i dati) possono "vedere immediatamente che provengono probabilmente da due diverse popolazioni". Ecco un semplice esempio usando i dati di @ Tim:

nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m        = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se       = c(sd(nonsmokers)/sqrt(length(nonsmokers)), 
             sd(smokers)/sqrt(length(smokers)))
windows()
  bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
  box()
  arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)

inserisci qui la descrizione dell'immagine

Detto questo, gli specialisti della visualizzazione dei dati in genere disdegnano questi grafici. Sono spesso derisi come "trame di dinamite" (cfr. Perché i trame di dinamite sono cattivi ). In particolare, se si hanno solo pochi dati, si consiglia spesso di mostrare semplicemente i dati stessi . Se i punti si sovrappongono, è possibile spostarli in senso orizzontale (aggiungere una piccola quantità di rumore casuale) in modo che non si sovrappongano più. Poiché un test t riguarda fondamentalmente la media e gli errori standard, è meglio sovrapporre la media e gli errori standard su tale trama. Ecco una versione diversa:

set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE, 
     xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)

inserisci qui la descrizione dell'immagine

Se disponi di molti dati, i boxplot potrebbero essere una scelta migliore per ottenere una rapida panoramica delle distribuzioni e puoi anche sovrapporre i mezzi e le SE.

data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m  = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see

inserisci qui la descrizione dell'immagine

Trame semplici dei dati e box box sono sufficientemente semplici da consentire alla maggior parte delle persone di capirli anche se non sono molto esperti statisticamente. Tieni presente, tuttavia, che nessuno di questi semplifica la valutazione della validità di aver utilizzato un test t per confrontare i tuoi gruppi. Questi obiettivi sono meglio serviti da diversi tipi di trame.

1. Si noti che questa discussione presuppone un test t per campioni indipendenti. Questi grafici potrebbero essere usati con un test t di campioni dipendenti, ma potrebbero anche essere fuorvianti in quel contesto (cfr. L' uso delle barre di errore per i mezzi in uno studio all'interno di soggetti è sbagliato? ).


Un grosso problema con l'utilizzo del grafico bar + CI è che a volte la differenza è statisticamente significativa, ma gli elementi della configurazione si sovrappongono . Dato che la trama bar + CI cerca di attirare un pubblico generalista, non vogliamo davvero passare il tempo a spiegare questa ruga in più.
Heisenberg,

@Heisenberg, ne sono consapevole. Non esiste una trama unica e perfetta per tutte le occasioni e tutti gli scopi. Inoltre, non ho menzionato gli elementi della configurazione, solo SE (sebbene ciò equivarrebbe ad alcuni CI, a seconda del df). L'importanza è comunemente menzionata nella didascalia della figura e discussa nel testo. Se vuoi che sia visualizzato in modo inequivocabile nel grafico stesso, puoi aggiungere parentesi e valori p (ad esempio, qui ).
gung - Ripristina Monica

Mi scuso se il tono sembra aggressivo. Sono solo un po 'seccato dal fatto che alla fine non ci sia ancora un modo elegante per visualizzare un test t per un pubblico generalista senza spiegare ulteriormente. Potrebbe venire alla trama: 2 grafici a barre che mostrano i mezzi di gruppo con SE e un terzo diagramma che mostra la differenza e il suo elemento della configurazione (come il tuo collegamento ). Ma tale visualizzazione mostra informazioni ridondanti (gruppi significa E differenza di mezzi), che potrebbe anche confondere il pubblico.
Heisenberg,

@Heisenberg, non userei la trama dell'altra mia risposta se non provassi a mostrare un test t all'interno dei pazienti. Penso che probabilmente sia spesso bene presentare 2 barre con SE per un test t, con una semplice didascalia. Se hai bisogno di significato nella trama, potresti aggiungere parentesi o qualcosa del genere (generalmente lo trovo superfluo).
gung - Ripristina Monica

14

t

> nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
> smokers <- c(16,20,14,21,20,18,13,15,17,21)
> 
> t.test(nonsmokers, smokers)

    Welch Two Sample t-test

data:  nonsmokers and smokers
t = 2.2573, df = 16.376, p-value = 0.03798
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.1628205 5.0371795
sample estimates:
mean of x mean of y 
     20.1      17.5 

inserisci qui la descrizione dell'immagine

In realtà, i grafici a scatole sono comunemente usati per test di ipotesi "informali", ad esempio come descritto da Yoav Benjamini nel documento del 1988 Apertura della scatola di un diagramma a scatole :

Il diagramma a scatola regolare è integrato da un intervallo di confidenza approssimativo per la mediana del lotto, mostrato come una coppia di zeppe estratte dai lati della scatola. Questi intervalli di confidenza sono costruiti in modo tale che quando due tacche di diversi grafici a scatole non si sovrappongono, le loro mediane sono significativamente diverse. (...) Poiché la formula per l'intervallo di confidenza è una costante per l'intervallo interquartile diviso per la radice quadrata della dimensione del lotto, quest'ultimo può essere percepito dalla lunghezza dei cunei rispetto alla lunghezza della scatola.

Vedi anche: T-test utilizzando solo i dati di riepilogo in un diagramma a riquadri

t

inserisci qui la descrizione dell'immagine

ttt-test in questa situazione. Il principale vantaggio di tale trama è che ti consente di giudicare facilmente l'entità della differenza dei mezzi guardando la pendenza della linea. Lo svantaggio può essere che potrebbe suggerire che vi sia una certa "continuità" tra i mezzi (cioè che avevi campioni accoppiati).

inserisci qui la descrizione dell'immagine

t

La prima considerazione è il valore informativo della figura nel testo del documento in cui deve apparire. Se la figura non si aggiunge in modo sostanziale alla comprensione del documento o duplica altri elementi del documento, non dovrebbe essere incluso.


4
Questo è davvero comune, anche nei testi che parlano di t-test e ANOVA, ma è comunque una scelta straordinaria. Il diagramma a scatole non mostra direttamente nessuna delle quantità coinvolte in un test t. In minima parte, un grafico pertinente dovrebbe mostrare i mezzi e fornire maggiori dettagli sulla distribuzione rispetto a un diagramma a scatole. Il dettaglio all'interno delle code è spesso cruciale nell'interpretazione del test.
Nick Cox,

OK @NickCox, il set di dati è stato scelto solo per la visualizzazione, ma ora l'ho cambiato in un esempio più appropriato.
Tim

3
La trama della barra (detta anche "trama della dinamite") ha un inchiostro estremamente elevato: rapporto di informazione.
Frank Harrell,

La citazione dal Manuale APA (non ho verificato il contesto) è un buon consiglio generale, ma non è di per sé un argomento diretto per l'utilizzo del box plot parzialmente rilevante in questo contesto. Concordo, naturalmente, sul fatto che i grafici a scatole possono essere molto utili e spesso complementari e che sono usati molto spesso, ma il mio primo punto rimane.
Nick Cox,

@NickCox Non posso dire di essere d'accordo con te, ma prenderei comunque in considerazione il boxplot per fornire informazioni aggiuntive e non duplicare i risultati del test t anche se non si riferisce direttamente al test t. È semplice, chiaro e informativo.
Tim

8

Questa è principalmente una variazione delle risposte utili di @Tim e @gung, ma i grafici non possono essere inseriti in un commento.

Punti piccoli ma forse utili:

  1. Una trama a strisce o una trama a punti come illustrato da @gung ha bisogno di essere modificata se ci sono legami, come ci sono nei dati di esempio. I punti possono essere raggruppati o distorti, oppure come nell'esempio seguente è possibile utilizzare un diagramma ibrido a scatola quantica come suggerito da Emanuel Parzen (il riferimento più accessibile è probabilmente il 1979. Modellazione di dati statistici non parametrici. Journal, American Statistical Association74: 105-121). Questo ha anche altri meriti, nel sottolineare che se metà dei dati sono all'interno della scatola, anche la metà è all'esterno e nel mostrare essenzialmente tutti i dettagli della distribuzione. Dove ci sono solo due gruppi, come in questo contesto, qualsiasi tipo più convenzionale di diagramma a scatole può essere un display minimale, anzi scheletrico. Alcuni lo prenderebbero come una virtù, ma c'è spazio per mostrare maggiori dettagli. L'argomento opposto è che un diagramma a riquadri che contrassegna determinati punti, in particolare quelli a più di 1,5 IQR dal quartile più vicino, è un chiaro avvertimento per l'utente: fai attenzione con un test t, poiché potrebbero esserci dei punti nelle code che dovresti preoccuparsi di.

  2. Puoi naturalmente aggiungere un'indicazione dei mezzi a un diagramma a scatole, cosa che viene fatta abbastanza spesso. L'aggiunta di un marcatore o di un punto diverso è comune. Qui scegliamo linee di riferimento.

inserisci qui la descrizione dell'immagine

Trame a scatola quantica per fumatori e non fumatori. Le caselle mostrano mediane e quartili. Le linee orizzontali in blu mostrano mezzi.

Nota. Il grafico è stato creato in Stata. Ecco il codice per chi è interessato. stripplotdeve essere installato in precedenza con ssc inst stripplot.

clear 
mat nonsmokers = (18,22,21,17,20,17,23,20,22,21)
mat smokers = (16,20,14,21,20,18,13,15,17,21)
local n = max(colsof(nonsmokers), colsof(smokers)) 
set obs `n' 
gen smokers = smokers[1, _n] 
gen nonsmokers = nonsmokers[1, _n] 
stripplot smokers nonsmokers, vertical cumul centre xla(, noticks) ///
xsc(ra(0.6 2.4)) refline(lcolor(blue)) height(0.5) box ///
ytitle(digit span score) yla(, ang(h)) mcolor(red) msize(medlarge) 

01+

inserisci qui la descrizione dell'immagine


1
+1, intendevo jitterare i dati, ma non sono ancora riuscito a raggiungerli. Stavo anche pensando di aggiungere grafici più avanzati, compresi i diagrammi a scatola quantica, i diagrammi di violino e i diagrammi qq, ma alla fine ho abbandonato l'idea di elencare sempre più diagrammi.
gung - Ripristina Monica

@gung Abbastanza giusto; sfortunatamente o per fortuna, il thread potrebbe facilmente trasformarsi in come confrontare due distribuzioni in generale. Per altri esempi di dati, gli istogrammi potrebbero essere un serio concorrente, ecc.
Nick Cox,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.