Perché jitter valore continuo in un diagramma a dispersione?


12

Sto usando Orange Canvas e ho generato un diagramma a dispersione. Ho la possibilità di jitter di variabili continue ma davvero non so perché dovrei farlo.

Qual è l'idea alla base del jittering?


1
Per gestire la sovrastampa e quindi dare un'impressione visiva meno fuorviante. Se hai solo pochi punti non è necessario farlo.
mdewey,

Per un esempio concreto di jitter che aiuta a vedere gli schemi nei dati, vedi la mia risposta qui: Come estrarre informazioni da una matrice scatterplot quando hai N grandi, dati discreti e molte variabili?
gung - Ripristina Monica

Risposte:


18

Questo post lo spiega bene.

Spesso quando hai molti punti sovrapposti, può essere difficile avere un senso per la loro densità. Duemila punti in (1, 1) appaiono uguali a un punto in (1, 1). L'aggiunta di alcuni jitter trasforma i punti sovrapposti in una sbavatura e rende evidente la densità dei punti.


Non si tratta di dati discreti, mentre la domanda si pone esplicitamente sui dati continui?
ameba dice Ripristina Monica il

Aggiungendo a ciò che @amoeba ha detto che questa risposta è corretta quando si aggiunge che i dati continui di cui ci occupiamo sono arrotondati a causa della precisione della misurazione e quindi si verificano problemi come sopra descritto.
Tim
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.