Formattazione dei grafici: quando è appropriato utilizzare un riempimento sotto un grafico a linee?


13

Questa è una domanda per la visualizzazione dei dati - spero che vada bene chiederlo qui.

Quando è appropriato usare un riempimento sotto un grafico a linee per una serie temporale, come il grafico qui sotto? (che mostra i tempi di ping nell'arco di un giorno)

Grafico a linee con riempimento sotto

Immagino sia più comune usare una linea semplice, senza riempimento sotto, ma è OK usare un riempimento per varietà visiva?

Sarei particolarmente interessato a conoscere qualsiasi ricerca percettiva sull'argomento o qualsiasi guida di stile.


1
Se 0sè il limite inferiore naturale e lo mostri, allora perché no?
ttnphns,

1
Chiedi in un altro modo: perché usare fill se non è necessario? Immagina di voler aggiungere un'altra linea di tendenza e le cose diventano inutilmente complicate. Separerei anche le unità e le scale dell'asse y.
Martin

Risposte:


11

C'è un po 'di arte nel bilanciare gli aspetti estetici e informativi di una grafica. Importanti consulenti / autori della visualizzazione come Edward Tufte e Stephen Few scelgono un'estetica minimale che evita la distrazione dalle parti informative del grafico. Tuttavia, per alcuni spettatori è giustificata una piccola quantità di attività, ad esempio l'applicazione giornalistica della visualizzazione dei dati di Alberto Cairo.

L'angolo di ricerca percettiva è che ogni elemento grafico comunica un messaggio, alcuni dei quali non siamo consapevolmente consapevoli perché la nostra corteccia visiva si occupa di esso (" elaborazione pre-attenta "). Gli elementi aggiuntivi, anche quelli ridondanti, possono comportare un'elaborazione aggiuntiva. Il grafico appropriato dipende dal messaggio da comunicare e dal pubblico.

Alla tua domanda specifica, una linea connessa enfatizza una tendenza (e la variazione da una tendenza). L'area riempita sottolinea la deviazione dalla linea di base. Un grafico a barre o un diagramma ad ago enfatizzerebbe gli eventi discreti che si discostano da una linea di base.

Anche il contesto grafico è importante. Se si dispone di una griglia di grafici strettamente compressi, il riempimento consentirà di associare ciascuna linea alla sua linea di base.

Infine, un'altra considerazione per l'aggiunta di elementi grafici / fioriture ridondanti è che rende più difficile estendere il grafico con elementi più informativi. Ad esempio, potresti voler evidenziare valori speciali, sovrapporre altre linee di tendenza o bande di sovrapposizione, come nel modello seguente.

inserisci qui la descrizione dell'immagine


1
Sono d'accordo con questo. A meno che il grafico non debba essere colorato perché è la copertina di una rivista / libro (e gli addetti al marketing lo vogliono colorato), il colore dovrebbe essere usato per informare. Se il grafico sembra "noioso", il colpevole è il fatto che le informazioni sottostanti non sono per niente interessanti o non molto interessanti nel formato del grafico a linee. In questi casi, forse sarebbe più utile in un grafico a torta, un diagramma radar o qualcos'altro.
rocinante,

1
Suggerisco di non usare un grafico a torta. È più difficile percepire differenze nella lunghezza dell'arco e nell'area del cuneo rispetto alle differenze di altezza. Se non mi credi, confronta un grafico a torta in rapporti 32:34:33 con lo stesso grafico a barre. Quale è più facile da leggere?
Shadowtalker

2
Stavo parlando in termini generali, non specificamente per il grafico sopra. Ogni tipo di grafico ha i suoi meriti. Un determinato tipo di grafico non è appropriato in tutte le situazioni.
rocinante,

4

Un altro paio di punti da considerare:

Come menzionato in un commento, un riempimento insufficiente è in gran parte inappropriato se l'asse x non si trova in un punto zero y naturale. Ciò potrebbe essere dovuto al fatto che l'asse y viene ridimensionato per iniziare con un numero diverso da zero o perché le unità utilizzate non hanno un'interpretazione zero naturale (ad es. Kelvin ha uno zero naturale, mentre Celsius no.)

In secondo luogo, un caso in cui un riempimento insufficiente è particolarmente valido è se i dati stessi potrebbero essere considerati insufficienti. Ad esempio, un diagramma a linee dell'altezza di una montagna ha senso essere insufficientemente riempito, il colore di riempimento rappresenta la terra, mentre non riempito rappresenta l'aria.

Un esempio correlato potrebbe essere il conteggio dei dati. Se raggruppassimo tutti gli individui in ciascun punto x, otterremmo un grafico a barre. Se l'interpolazione tra le barre ha senso si finirebbe con un grafico a linee con un riempimento insufficiente.

Questa immagine della "visualizzazione visiva di informazioni quantitative" potrebbe spiegarla un po 'meglio. Mostra quali unità militari erano in Europa durante la seconda guerra (credo). Impilando le unità in ogni momento si ottiene un grafico a barre insufficiente. Tracciare una linea sopra i dati ti dà un grafico a linee insufficiente.


2
... Le unità militari statunitensi erano in Europa durante la prima guerra mondiale (le date del 1917 e del 1918 raccontano la storia).
Nick Cox,

@nickCox Certo. Non ho idea del perché non l'ho visto.
timcdlucas,

4

Le due risposte precedenti coprono i principali punti importanti, ma ci sono alcune cose che dovrebbero ancora essere menzionate.

Innanzitutto, dovrei dire che non sono d'accordo con l'estremo approccio minimalista alla rappresentazione grafica - che tutto l'inchiostro ridondante deve andare. Variazioni distruttive e non significative dovrebbero andare. Ma un'area solida rispetto a una singola linea può attirare meglio l'attenzione e comunicare di più a colpo d'occhio. E come dici tu, può aggiungere "varietà visiva".

Tuttavia, come sottolinea @xan, quella rapida occhiata interpreta anche un'area in modo diverso da una linea, in modo parzialmente inconscio.

Un grafico ad area implica l'accumulo di una quantità totale mentre si procede lungo l'asse x. Se si confrontano due grafici e uno ha riempito un'area più grande, il tuo sguardo ti dirà che ha un totale maggiore indipendentemente dai valori di inizio e fine.

Al contrario, un grafico a linee mostra un valore variabile. L'attenzione si concentra sul cambiamento di posizione da un punto all'altro, non sul totale accumulato.

Quindi, quando dovresti usare un grafico ad area?

  • quando i valori rappresentano una quantità chiara con un punto zero definito mostrato sul grafico;
  • quando il valore rappresenta un importo aggiunto (o rimosso) in ciascun punto, come una normale pioggia giornaliera o un utile / perdita mensile;
  • quando il valore rappresenta una distribuzione di una popolazione, il che significa che l'area totale sotto la curva rappresenta la dimensione totale del campione, come la curva a campana del numero di studenti con voti diversi (sostanzialmente un istogramma levigato).

L'idea è che, quando si legge il grafico, se si prendono due punti sull'asse x, l'area mostrata tra loro dovrebbe rappresentare una quantità effettiva di qualcosa che si accumula in quell'intervallo. Per questo motivo, se i tuoi valori includono importi negativi, ti consiglio di usare colori opposti per le aree negative e positive per sottolineare che si annullano nel totale.

Quando non dovresti usare un grafico ad area?

  • quando il punto zero è arbitrario (come nella temperatura non assoluta, come diceva @timcdlucas), non valido (come nelle misurazioni che hanno un rapporto di due valori, come un tasso di cambio), o non mostrato sul grafico per motivi di spazio;
  • quando i valori indicati dall'altezza della linea rappresentano già una misura cumulativa, come la pioggia totale fino ad oggi (per il mese / anno) o debito / risparmio;
  • quando i valori rappresentano la posizione / valore di una singola entità che cambia anziché un accumulo;
  • quando vuoi confrontare più linee sullo stesso grafico (se non riesci a vedere l'intera area, perdi il significato - confronta invece i grafici ad area affiancati).

Con queste linee guida in mente, il tuo grafico ping può essere interpretato in due modi.

Da un lato, se pensi alla velocità del ping come a una singola variabile che cambia nel corso della giornata, un semplice grafico a linee sarebbe più appropriato.

D'altra parte, se si stessero confrontando i modelli di velocità di ping giornalieri di due reti diverse (o la stessa rete in giorni / periodi di tempo diversi), forse si desidera enfatizzare il tempo totale richiesto per le attività di rete. Ad esempio, se il grafico avesse più picchi, anziché solo uno, un grafico a linee enfatizzerebbe la variabilità della velocità mentre un grafico ad area enfatizzerebbe il ritardo totale.

Confronta:
Grafico a linee Stesso grafico con area riempita
il totale cumulativo è leggermente maggiore nella prima metà del grafico (a sinistra della linea rossa) rispetto alla seconda, anche se i picchi raggiungono valori massimi più alti a destra. Il riempimento enfatizza quel blocco solido a sinistra, in modo che si bilanci meglio contro le cime.

(Perdona la scarsa qualità dell'immagine - non riuscivo a capire come far fare a R un grafico ad area! Ho dovuto esportare e modificare separatamente.)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.