Nel mio campo il solito modo per tracciare i dati accoppiati è come una serie di sottili segmenti di linea inclinati, sovrapponendoli con la mediana e CI della mediana per i due gruppi:
Tuttavia, questo tipo di trama diventa molto più difficile da leggere quando il numero di punti dati diventa molto grande (nel mio caso ho nell'ordine di 10000 coppie):
Ridurre l'alfa aiuta un po ', ma non è ancora eccezionale. Durante la ricerca di una soluzione mi sono imbattuto in questo documento e ho deciso di provare a implementare un "diagramma a linee parallele". Ancora una volta, funziona molto bene con un numero limitato di punti dati:
Suppongo che potrei mostrare separatamente le distribuzioni per i due gruppi, ad esempio con boxplot o violini, e tracciare una linea con errorbar in alto che mostra i due mediani / CI, ma non mi piace davvero quell'idea, dal momento che non trasmetterebbe la natura accoppiata dei dati.
Inoltre, non sono troppo appassionato dell'idea di un grafico a dispersione 2D: preferirei una rappresentazione più compatta, e idealmente una rappresentazione in cui i valori per i due gruppi sono tracciati lungo lo stesso asse. Per completezza, ecco come si presentano i dati come uno scatter 2D:
Qualcuno conosce un modo migliore per rappresentare i dati associati con una dimensione del campione molto grande? Potresti collegarmi ad alcuni esempi?
modificare
Mi dispiace, chiaramente non ho fatto un lavoro abbastanza buono per spiegare quello che sto cercando. Sì, il grafico a dispersione 2D funziona e ci sono molti modi in cui potrebbe essere migliorato per comunicare meglio la densità dei punti - Potrei codificare i punti in base a una stima della densità del kernel, potrei fare un istogramma 2D , Potrei tracciare contorni sopra i punti ecc., Ecc ...
Tuttavia, penso che questo sia eccessivo per il messaggio che sto cercando di trasmettere. Non mi interessa davvero mostrare la densità 2D dei punti di per sé - tutto quello che devo fare è mostrare che i valori per "barre" sono generalmente più grandi di quelli per "punti", nel modo più semplice e chiaro possibile e senza perdere la natura essenziale dei dati associati. Idealmente, vorrei tracciare i valori accoppiati per i due gruppi lungo gli stessi assi piuttosto che ortogonali, poiché ciò semplifica il confronto visivo.
Forse non esiste un'opzione migliore di un diagramma a dispersione, ma mi piacerebbe sapere se ci sono alternative che potrebbero funzionare.
bar
sull'asse orizzontale edot
verticale come un diagramma a dispersione?