Quali sono le alternative agli assi rotti?


28

Gli utenti sono spesso tentati di rompere i valori degli assi per presentare i dati di diversi ordini di grandezza sullo stesso grafico (vedi qui ). Mentre questo può essere conveniente, non è sempre il modo preferito di visualizzare i dati (può essere fuorviante nella migliore delle ipotesi). Quali sono modi alternativi di visualizzare i dati che sono diversi in diversi ordini di grandezza?

Posso pensare a due modi, per trasformare i dati in log o usare trame reticolari. Quali sono le altre opzioni?


1
Quelle guide di Excel sembrano piuttosto inquietanti ...

5
Riesci a immaginare come appare un tutorial su R a una persona che non ha mai visto una linea di codice in vita sua? :)
Roman Luštrik,

3
Ok, ma posso anche immaginare tutte quelle persone che disegnano manualmente dozzine di interruzioni di barra in Excel e credono che sia un modo unico (e quindi più semplice e veloce) per farlo. O persone che passano ore a cercare di unificare la formattazione in un documento Word di grandi dimensioni.

1
"Padre, perdona loro, perché non sanno cosa stanno facendo." viene in mente. :)
Roman Luštrik,

3
Banda ufficiale di stats.stackexchange.com: The Broken Axes.
Matt Parker,

Risposte:


17

Sono molto diffidente nell'utilizzare gli assi logaritmici sui grafici a barre . Il problema è che devi scegliere un punto di partenza dell'asse, e questo è quasi sempre arbitrario. Puoi scegliere di fare in modo che due barre abbiano altezze molto diverse, o quasi della stessa altezza, semplicemente modificando il valore minimo sull'asse. Questi tre grafici tracciano tutti gli stessi dati: testo alternativo

Un'alternativa agli assi discontinui, che nessuno ha ancora menzionato, è semplicemente mostrare una tabella di valori. In molti casi, le tabelle sono più facili da comprendere rispetto ai grafici.


3
Quei grafici sembrano molto ingannevoli anche perché non ci sono barre di errore. Se aggiungi barre di errore, la differenza apparirà meno sostanziale. Oppure puoi usare trame box-and-whisker che per lo più evitano questo tipo di problemi.
nico,

5
IMHO l'origine è un problema dei grafici a barre e non ha nulla a che fare con il logaritmo. Puoi raggiungere la stessa impressione ingannevole con assi lineari.
cbeleites supporta Monica il

@cbeleites. Sì, è possibile creare grafici a barre fuorvianti con un asse lineare modificando la linea di base. Ma con un asse lineare, la linea di base naturale è zero. Con gli assi logaritmici, nella maggior parte dei contesti, non esiste una linea di base naturale.
Harvey Motulsky

@HarveyMotulsky: mi permetto di non essere d'accordo. Esiste un'intera classe di dati che è ben descritta dagli assi del log e che ha una base naturale: cambiamenti / rapporti moltiplicativi. Nel tuo esempio, forse il segnale trattato è 15 volte il segnale di controllo. Se tale presupposto ha senso per l'applicazione, si dispone di una linea di base "naturale" per il registro. In caso contrario, forse un'altra trasformazione è più sensata?
cbeleites supporta Monica il

1
@cbeleites Sono d'accordo sul fatto che se la variabile è un rapporto, quindi 1.0 è una linea di base naturale, allora mostrarla su una scala di log ha senso.
Harvey Motulsky

11

Alcune idee aggiuntive:

(1) Non è necessario limitarsi a una trasformazione logaritmica. Cerca in questo sito il tag "trasformazione dati", ad esempio. Alcuni dati si prestano bene a determinate trasformazioni come una radice o un logit. (Tali trasformazioni - persino i registri - di solito devono essere evitate quando si pubblicano grafici per un pubblico non tecnico. D'altra parte, possono essere strumenti eccellenti per vedere i modelli nei dati.)

(2) È possibile prendere in prestito una tecnica cartografica standard per l'inserimento di un dettaglio di una carta all'interno o accanto alla carta. In particolare, tracciare i valori estremi da soli su un grafico e tutti (o il) resto dei dati su un altro con un intervallo di assi più limitato, quindi disporre graficamente i due insieme alle indicazioni (visive e / o scritte) della relazione tra loro. Pensa a una mappa degli Stati Uniti in cui l'Alaska e le Hawaii sono inserite a diverse scale. (Questo non funzionerà con tutti i tipi di grafici, ma potrebbe essere efficace con i grafici a barre nella tua illustrazione.) [Vedo che è simile alla recente risposta di mbq.]

(3) Puoi mostrare il diagramma rotto fianco a fianco con lo stesso diagramma su assi ininterrotti.

(4) Nel caso del tuo esempio di grafico a barre, scegli un asse verticale adatto (forse enormemente allungato) e fornisci un'utilità di panoramica. [Questo è più un trucco che una tecnica veramente utile, IMHO, ma potrebbe essere utile in alcuni casi speciali.]

(5) Selezionare uno schema diverso per visualizzare i dati. Invece di un grafico a barre che utilizza la lunghezza per rappresentare i valori, scegliere un grafico in cui le aree dei simboli rappresentano i valori, ad esempio. [Ovviamente sono coinvolti compromessi qui.]

La scelta della tecnica dipenderà probabilmente dallo scopo della trama: le trame create per l'esplorazione dei dati spesso differiscono dalle trame per il pubblico generale, ad esempio.


8

Forse può essere classificato come reticolo, ma ci proverò; tracciare tutte le barre ridimensionate al massimo in un riquadro e posizionare un altro riquadro che mostra lo zoom su quelli inferiori. Ho usato questa tecnica una volta in caso di un diagramma a dispersione, e il risultato è stato abbastanza buono.


8

Separerei il problema degli assi di registro dal problema dei grafici a barre.


UN=lgio0-lgioio0

I grafici a barre non possono mai essere sensibili se non esiste un'origine sensibile e fissa che assume il ruolo di controllo (linea di base, vuoto). Ma questo non ha nulla a che fare con gli assi del tronco.
L'unico uso regolare che ho per i grafici a barre sono gli istogrammi. Ma potrei immaginare che facciano bene a mostrare la differenza rispetto a questa origine (puoi anche vedere immediatamente se la differenza è positiva o negativa). Poiché le barre rappresentano un'area, tendo a pensare ai diagrammi a barre come una versione molto discretizzata dell'area sotto una curva. Cioè, l'asse x dovrebbe avere un significato metrico (che potrebbe essere il caso del tempo, ma non delle città).

Se mi trovassi a chiedermi quale origine utilizzare per il registro di qualcosa che aveva un'origine "naturale" a 0, farei un passo indietro e penserei un po 'a quello che sta succedendo. Molto spesso, tali problemi sono solo un indicatore del fatto che il registro non è una trasformazione ragionevole qui.

Ora un grafico a barre con assi di registro enfatizzerebbe gli aumenti o le diminuzioni che si verificano in multipli. Esempi sensati a cui riesco a pensare in questo momento hanno tutti una relazione lineare con un valore di interesse. Ma forse qualcun altro trova un buon esempio.

Quindi penso che la trasformazione dei dati dovrebbe essere sensata rispetto al significato dei dati a portata di mano. Questo è il caso delle unità fisico-chimiche che ho menzionato sopra (A è proporzionale alle concentrazioni e il pH ha, ad esempio, una relazione lineare con la tensione in un pH-metro). In effetti, è così tanto che l'unità di registro ottiene un nuovo nome e viene utilizzata in modo lineare.

Ultimo, ma non meno importante, vengo dalla spettroscopia vibrazionale, in cui gli assi spezzati sono usati abbastanza regolarmente. E considero questo uso uno dei pochi esempi in cui la rottura degli assi non inganna. Tuttavia, non abbiamo cambiamenti nell'ordine di grandezza. Abbiamo solo una regione non informativa del 30 - 40% della nostra gamma x: Ecco un esempio: spettro per questo esempio, la parte tra 1800 - 2800 / cm non può contenere alcuna informazione utile.
La gamma spettrale non informativa viene quindi rimossa (che indica anche le gamme spettrali che effettivamente utilizziamo per la modellazione chemiometrica): parte non informativa dello spettro rimossa

Ma per l'interpretazione dei dati, abbiamo bisogno di letture precise della posizione x. Ma generalmente non abbiamo bisogno di multipli che abbracciano i diversi intervalli (cioè ci sono tali relazioni, ma la maggior parte delle connessioni sono più complicate. Ad esempio: segnale a 3050 / cm, quindi abbiamo sostanza insatura o aromatica. Ma nessun segnale forte a 1000 / cm , quindi nessun anello aromatico mono, meta, né 1,3,5 sostituito ...)
Quindi è meglio rappresentare x con una scala più grande (in realtà spesso usiamo guide come fogli millimetrici o etichettiamo le posizioni esatte). Quindi, rompiamo l'asse e otteniamo un ridimensionamento x più grande: spettro - asse rotto

In realtà, è molto simile alla sfaccettatura: versione sfaccettata
ma l'asse rotto IMHO sottolinea che la scala dell'asse x in entrambe le parti è la stessa. Vale a dire gli intervalli all'interno delle regioni tracciate sono gli stessi.

Per enfatizzare le piccole intensità (asse y), utilizziamo inserti ingranditi:
inserisci qui la descrizione dell'immagine
[ ... Per i dettagli, vedi la regione ingrandita (x 20) νCH in blu .... ]

E questo è certamente possibile anche con l'esempio nelle trame collegate.


2

Due idee a cui si è accennato, ma che non sono state esplicitamente descritte quando ho esaminato le risposte e i commenti eccellenti, erano che stai usando un grafico a barre "in un modo incompatibile con l'etichettatura" e con dati normalizzati / senza dimensioni.

Tipo di trama:

La carta in stile stella / ragno / radar (collegamento) (collegamento) è spesso molto utile per confrontare diverse cose lungo più coordinate. Ci sono una serie di trame molto utili che (purtroppo) sono rare nelle presentazioni aziendali, probabilmente perché la leadership preferisce usare le conclusioni per prendere decisioni piuttosto che usare le informazioni per capire e quindi usare la comprensione per prendere le decisioni. Nel mondo degli affari a volte è molto difficile creare consenso e quindi l'approccio basato sui soli risultati può avere un rendimento più elevato in un ambiente basato sul consenso e sulla decisione successiva. Questo informa la popolarità del grafico a barre / colonne. Considera gli esempi di altri tipi di grafici che sono utili per acquisire comprensione (link) .

Trasformazione:

Se si dividono i valori che si stanno creando grafici per un valore "caratteristico", è possibile trasformare il ridimensionamento per migliorare la leggibilità senza perdere informazioni. I fluidisti dinamici preferiscono numeri senza dimensioni a causa della loro utilità predittiva e della loro elasticità nell'applicazione. Considerano cose come il Teorema di Buckingham Pi come fonti per le forme candidate senza dimensione (link) . Numeri popolari e utili e senza dimensioni includono il numero di Reynolds, il numero di Mach, il numero di Biot, il numero di Grashof, il Pi, il numero di Raleigh, il numero di Stokes e il numero di Sherwood. (link) Non devi essere un fisico per amare i numeri senza dimensioni perché sono utili in applicazioni non fisiche. Misure come densità, omogeneità, circolarità e complanarità possono definire immagini, campi di pixel o distribuzioni di probabilità multivariate. Non considerare solo di prendere un logaritmo o una distanza relativa da un valore noto, ma puoi anche considerare di invertire i numeri, prendendo le loro radici quadrate.

Buona fortuna. Fateci sapere come vanno le cose.


1
La maggior parte delle autorità di controllo dei dati si oppongono fermamente all'uso delle carte radar. Sono difficili da interpretare. Un'alternativa molto migliore è un grafico di coordinate parallele .
Jon Peltier,

@JonPeltier - Sono d'accordo, ma Excel non aveva (al momento in cui ho risposto) un modo chiaro per creare un grafico a coordinate parallele, quindi è probabile che il suo pubblico farà fatica a comprendere.
EngrStudent - Ripristina Monica

1

La soluzione ad asse spezzato funziona meglio quando c'è un'interruzione chiara attraverso la trama e l'ordinata è etichettata in modo che il divario sia evidente. Il vantaggio di ciò è che la scala viene preservata attraverso le due serie di valori. I grafici a pannelli con scale diverse potrebbero non trasmettere la variazione relativa all'interno dei gruppi basso e alto. Mi piace l'idea del diagramma di ingrandimento, che ho programmato per i grafici a dispersione ma che non avevo pensato di utilizzare per i grafici a barre.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.