Leggere trame di scatole e baffi: è possibile raccogliere differenze significative tra i gruppi?


11

Supponiamo che stiamo guardando questo complotto box-and-whisker:

tracciare

Tra giovedì e venerdì, penso che la maggior parte sarebbe d'accordo sul fatto che sembra esserci una differenza significativa nel tempo dormito. È una congettura statisticamente valida, però? Possiamo discernere differenze significative dovute al fatto che nessuna delle gamme del quartile interno si sovrappone tra giovedì e venerdì? Che dire del fatto che i baffi superiore e inferiore di giovedì e venerdì, rispettivamente, si sovrappongono? Ciò influisce sulla nostra analisi?

Di solito accompagnare un grafico come questo sarebbe una sorta di ANOVA, ma sono solo curioso di sapere quanto possiamo dire sulle differenze tra i gruppi semplicemente guardando un diagramma a scatole .


I cerchi rappresentano valori anomali.
Michael R. Chernick,

3
Finché la trama manca di qualsiasi indicazione della dimensione del campione, è difficile. Ma se includi con gli intervalli di confidenza della trama per le mediane, potresti confrontare questi intervalli di confidenza. Non sembrano essere presenti nella trama.
kjetil b halvorsen,

@kjetilbhalvorsen questa è solo una trama che afferro a Google :) ... Ho incluso, sulla mia trama, esattamente quello che hai descritto, come parte di un test HSD di Tukey
blacksite,

2
Senza gli EC, non puoi parlare di differenze "significative". Tuttavia, direi che c'è una differenza "notevole" tra giovedì e venerdì. O anche "la differenza più notevole" si verifica tra giovedì e venerdì ..
Ashe

1
I cerchi sono punti a più di 1,5 IQR dal quartile più vicino. Non sono valori anomali inequivocabili e oggettivi. Che per giovedì non sembra straordinario rispetto al resto della distribuzione. Questo per venerdì fa davvero; e un ricercatore o analista dovrebbe voler controllare se possibile e vedere se c'è una storia da spiegare. Forse qualcuno davvero non ha dormito! Contrassegnare i punti dati in questo modo significa contrassegnarli per l'ispezione e il pensiero. Non è un metodo statistico per identificare i demoni da esorcizzare.
Nick Cox,

Risposte:


4

No, non puoi. Se avessi le dimensioni del campione e molta esperienza potresti essere in grado di indovinare - e l'accuratezza delle tue ipotesi dipenderebbe (oltre alle dimensioni dell'effetto) dalle dimensioni del campione. Se N = 1.000.000 per gruppo, un sacco di significato. Se N = 10 per gruppo, non così tanto. A 100 per gruppo è più difficile indovinare.

Direi che è una buona cosa. La cosa da fare con un diagramma a scatole non è cercare di indovinare il significato statistico ma di guardare cosa sta succedendo e provare a ragionare su di esso. Hmm. Più dormire nei fine settimana. È interessante ma non molto sorprendente. Potremmo modellare ore di sonno in funzione del fine settimana rispetto a non. Oppure potremmo provare a vedere se questo schema varia. Forse i pensionati non hanno questo schema? E i lavoratori a turni? Le persone che lavorano nei fine settimana? Persone che lavorano 7 giorni a settimana?

Come diceva il mio professore preferito alla scuola di specializzazione (Herman Friedman): "Smetti di fare ricerche!"


1
N<5

8

Si, puoi. Almeno in senso approssimativo.

Descrivo come di seguito (e in effetti c'è una relazione con la "sovrapposizione di riquadri" come suggerisci) insieme ad alcuni avvertimenti e limitazioni. Ma prima discutiamo alcuni preliminari per alcuni retroscena e contesto. (Penso che una risposta appropriata qui non dovrebbe concentrarsi sui dettagli dell'esempio - sebbene ciò meriti forse una menzione a parte - ma sulla questione centrale dell'uso dei grafici a scatola per valutare se le differenze apparenti possano essere prontamente spiegate come variazione casuale o no .)

Se hai accesso ai dati puoi disegnare grafici a scatole intagliati che sono progettati per questo tipo di confronto visivo.

Immagine che mostra i riquadri dentellati in R

C'è una discussione sui calcoli intagliati del diagramma a scatole qui . Se gli intervalli di notch non si sovrappongono, i due gruppi confrontati sono approssimativamente diversi al livello del 5%; i calcoli si basano su calcoli al normale, ma sono piuttosto robusti e funzionano ragionevolmente bene su una vasta gamma di distribuzioni. (Se viene trattato come un test formale, la potenza non è così elevata al normale, ma dovrebbe fare abbastanza bene per una varietà di casi più o meno "tipici" dalla coda più pesante.)

Considerando come funzionano i grafici a scatole intagliati, puoi discernere una rapida regola empirica che funzionerà quando hai solo un display come quello nella domanda. Quando la dimensione del campione è 10 e la mediana è posizionata vicino al centro della scatola, le tacche in un diagramma a scatola dentellato hanno circa la larghezza della scatola, quindi le estremità della tacca e la scatola si trovano all'incirca nello stesso posto.

n=10

n=10

n=9n=10

n=10n=10,10n=9,9n=8,8

nnn=40

Guardando la trama:

Si noti che dall'aspetto della trama nella domanda possiamo dire che le dimensioni del campione devono essere almeno 5; se fossero inferiori a 5 i grafici a scatola dei singoli campioni avrebbero indizi distinti che provenivano da una dimensione del campione inferiore (come i mediani essendo il punto morto di ogni scatola o il baffo di lunghezza 0 quando c'era un valore anomalo).

In alternativa, se le caselle (contrassegnando i quartili) non si sovrappongono e la dimensione del campione è di almeno 10, i due gruppi confrontati dovrebbero avere mediane diverse al livello del 5% (considerato come un singolo confronto a coppie).

nn=5

[Si noti che ciò non tiene conto del numero di confronti, quindi se si effettuano confronti multipli l'errore di tipo I complessivo sarà maggiore. È pensato per un'ispezione visiva piuttosto che per un test formale; tuttavia le idee coinvolte possono essere adattate a un approccio più formale, compreso l'adeguamento per confronti multipli.]

Avendo affrontato se è possibile , sarebbe ragionevole considerare se si dovrebbe . Forse no; il problema del potenziale p-hacking è reale, ma se lo stai usando per capire se, ad esempio, continuare a raccogliere nuovi dati sul problema della ricerca e tutto ciò che hai è un boxplot in un documento - diciamo - potrebbe essere abbastanza utile per essere in grado di valutare se c'è di più di quello che potrebbe essere facilmente spiegato dalle variazioni dovute al rumore. Ma considerare questo problema in profondità significherebbe davvero rispondere a una domanda diversa.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.