Mentre facevo un po 'di EDA ho deciso di usare un diagramma a scatole per illustrare la differenza tra due livelli di un fattore.
Il modo in cui ggplot ha reso la trama della scatola è stato soddisfacente, ma leggermente semplicistico (prima trama sotto). Mentre cercavo le caratteristiche dei grafici a scatole, ho iniziato a sperimentare le tacche.
Capisco che le tacche mostrano l'IC attorno alla mediana e che se le tacche di due caselle non si sovrappongono, c'è una "forte evidenza" - con un livello di confidenza del 95% - che le mediane differiscono.
Nel mio caso (seconda trama), le tacche non si sovrappongono in modo significativo. Ma perché il fondo della scatola sul lato destro assume quella strana forma?
Tracciare gli stessi dati in un diagramma di violino non indicava nulla di insolito sulla densità di probabilità del violino corrispondente.
ggplot2
. Mi piace l'idea di tracciare anche i singoli punti dati, ma è frustrato in quanto i punti all'interno della scatola scura sono resi invisibili.