Visualizzazione efficace dei dati demografici su una mappa stampata


29

Vorrei tracciare i seguenti dati per zona (30 zone in totale) su una mappa stampabile / non interattiva:

  • Età media
  • Reddito familiare medio
  • Numero di famiglie
  • Densità demografica
  • Numero di persone
  • Numero di lavoratori

Come visualizzeresti efficacemente i 6 livelli precedenti su una mappa?


1
Quanto sono grandi le zone rispetto alle dimensioni della pagina? Riesci ad adattare una piccola trama in ogni zona? (es. una carta radar)
djq

@celenius -È un tipico tipo di censimento del censimento, in cui le zone del centro sono molto più piccole delle zone residenziali che sono significativamente più piccole delle zone suburbane / rurali
dassouki,

1
Questi 6 livelli su una mappa statica sono un duro lavoro di progettazione. Qual è il problema che impedisce l'uso di una mappa interattiva?
Trevesy,

@Trevesy - per la maggior parte, il requisito è progettare una mappa stampabile che evidenzi le 6 variabili per promuovere l'analisi visiva
dassouki,

1
Mi sono preso la libertà di aggiungere il tag di visualizzazione, sentiti libero di rimuoverlo se ritieni che sia inappropriato.
Andy W,

Risposte:


20

Direi che non puoi includere tutti quei dati su una mappa e avere senso. Ti consiglierei di pensare sulla falsariga del principio dei piccoli multipli di Tufte, avendo più mappe più piccole della stessa area, ognuna usando una variabile diversa. Esempio: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Anche allora, hai il problema che stai usando un gruppo di unità diverse, quindi hai bisogno di un mazzo di chiavi. Un altro modo per visualizzare i dati (ma non in una mappa) sarebbe usare una tabella con tutti i valori, colorati (cioè - colori diversi per sotto la media, media, sopra la media)

Consiglierei anche di guardare l'atlante del censimento per ulteriori idee sulla mappa: http://www.census.gov/population/www/cen2000/censusatlas/

Potrebbe aiutare a riflettere di più su quale messaggio stai cercando di comunicare, esattamente (non solo su quali dati hai).


5
+1 È molto meglio che fare un pasticcio cercando di simbolizzare sei variabili contemporaneamente. Inoltre, perché non stampare una tabella dei dati? Sei colonne + ID, 30 righe: è sufficientemente piccolo e offre tutti i dettagli di cui tutti avrebbero bisogno.
whuber

13

Non è possibile mostrare in modo efficiente così tanti dati su una singola mappa. Due possibilità:

  • Produrre 6 mappe,

  • Analizza i tuoi dati per classificare le tue regioni e visualizza il risultato della classificazione. Un'analisi dei componenti principali può aiutare a determinare le correlazioni più importanti all'interno della variabile. Questo metodo è stato utilizzato per produrre questa mappa sintetica:

testo alternativo

da questi:

testo alternativo testo alternativo


Il problema con avere 6 mappe è che è difficile determinare visivamente eventuali tendenze. A volte, è bello guardare una mappa con più variabili e vedere come si allineano le cose
dassouki,

2
@dassouki, per vedere come si allineano le cose non devi necessariamente mapparle. I grafici a dispersione bivariati soddisferebbero tali criteri e sarebbero molto più facili da interpretare.
Andy W,

3
Il vantaggio di avere 6 mappe è che è facile identificare visivamente le tendenze! Quando si tenta di raggruppare sei (o più) variabili in una singola mappa, può diventare difficile trovare schemi. (Se questa mappa includesse migliaia di funzionalità, cambierei questa osservazione, tuttavia: alcuni tipi di mappatura, come la visualizzazione dei glifi , possono essere straordinariamente efficaci per trovare schemi in set di dati riccamente multivariati: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber

@julien, cose interessanti, potresti essere interessato a questo articolo che ho appena incontrato, e-publications.org/ims/submission/index.php/AOAS/user/… , ha mappe con analisi PCA associate di simili multi-variate dati e codice R per creare i grafici.
Andy W,

Davvero interessante, dovrò leggere su questo.
neuhausr,

9

Concordo sul fatto che i piccoli multipli sono probabilmente un buon modo per affrontare questo problema. Per integrare la mappa, suggerirei anche una matrice scatterplot delle variabili, che identificherebbe le correlazioni bivariate. Mentre perdi l'aspetto geografico dei tuoi dati, è molto più semplice visualizzare le relazioni tra le variabili in un diagramma a dispersione piuttosto che confrontare due mappe (anche fianco a fianco).

Se desideri comunque acquisire una sorta di trend spaziali catturati, potresti includere statistiche spaziali (come l'I locale di Moran) tra le distribuzioni e / o le variabili originali.

Modifica: Di recente mi sono imbattuto in alcuni lavori che hanno rivisitato le statistiche morali pubblicate da Andre-Michel Guerry (originariamente nel 1883) con l'obiettivo di visualizzare relazioni multi-variabile nello spazio. Le implementazioni di quegli autori sono molto simili a quanto è stato suggerito in questo thread, piccoli multipli, analisi dei componenti principali, matrici di grafici a dispersione e all'interno di diagrammi poligonali. In allegato alcune immagini di A.-M. Guerry's Moral Statistics of France: Sfide per l'analisi spaziale multivariabile di: Michael Friendly Statistical Science, Vol. 22, n. 3. (agosto 2007), pagg. 368-399 (Il PDF è gratuito). Anche un altro articolo ( Dray e Jombart, 2010 ) analizza gli stessi dati e ha del codice sorgente in R per creare tali grafici.

Una foto è una matrice scatterplot, l'altra è quello che viene chiamato un diagramma a stella (che è solo un modo diverso di rappresentare i grafici a barre come suggerito da Pablo). testo alternativo testo alternativo


8

Ecco un meraviglioso esempio di piccoli multipli pubblicati sul modello statistico, sull'inferenza causale e sulle scienze sociali di Andrew Gelman (e blog aziendale) . La mappa è di supporto degli elettori per i buoni scolastici da parte dello Stato, a seconda del reddito e di varie categorie di razza e religione. Ai non evangelici bianchi non piacciono davvero i buoni scuola! (Se vai sul blog vero e proprio anche se appare nei dati del sondaggio del 2004, c'è più supporto per i buoni scuola all'interno di quel gruppo). inserisci qui la descrizione dell'immagine


Il grafico è interessante, ma la scala dei colori è orribile. Perché il 50% è così prioritario, rendendolo grigio? Sicuramente dovrebbe usare solo i colori della mappa di calore, o qualcosa del genere? Inoltre, perché solo le persone sono divise in religione? sicuramente avrebbe più senso dividere per razza e poi per religione?
naught101

@ naught101, sono un po 'confuso dalla tua negatività. Sicuramente il grigio è de-enfatizzato rispetto ai colori più chiari o più scuri alle due estremità dello spettro. Mentre sono abivalente riguardo alla divergenza arbitraria al 45%, IMO quando si realizzano piccole mappe multiple come queste è vantaggioso avere valori altamente contrastanti. Il commento sulla scissione religione / razza non ha molto senso neanche l'IMO. Queste sono categorie che sono ovviamente molto correlate al fatto che un singolo supporto supporti, e sembra che alcuni dei sottoinsiemi che suggerisci non esistano. cont ...
Andy W,

IE Dubito fortemente che ci siano abbastanza "Cattolici neri" nel sondaggio per dire qualcosa di sostanziale su un simile gruppo (né "Ispanici non-Evang protestanti). Suggerirei di leggere il post di Gelman e speriamo che chiarisca la motivazione per i sottogruppi.
Andy W,

forse è solo quel particolare grigio che sporge sul mio schermo. Penso che sarebbe meglio con il bianco e forse uno sfondo grigio per distinguerlo. Vale anche la pena notare che le due immagini sul blog di Gelman hanno scale diverse ... Avevo l'impressione che la popolazione nera fosse molto più alta, ma ho appena guardato i dati del censimento e sono stato corretto. Una cosa strana, tuttavia, è che il censimento definisce l'origine ispanica come ortogonale alla razza (è una domanda separata). Immagino che le distinzioni di Gelman siano definite in modo diverso ..
niente101

@ naught101 queste non sono informazioni dal censimento, ma da qualche altro sondaggio (il censimento non ha alcuna opinione pubblica su di esso)
Andy W

5

Per scegliere tra le soluzioni presentate qui, è possibile fornire due informazioni chiave:

  • qual è lo scopo della mappa? (Scopri, esponi?)
  • qual è il pubblico previsto della mappa? (Tu, colleghi analisti, urbanista, pubblico?)

Le soluzioni qui citate possono avere un'efficienza diversa in base allo scopo e al pubblico.

Vorrei generalizzare la risposta di Julien (una mappa sintetica tramite un PCA) citando la tecnica della diagonalizzazione della matrice, descritta da J. Bertin. È utile quando si cerca una sintesi di tutte le informazioni, piuttosto che una presentazione completa dei dati.

In breve, consiste nel rappresentare ogni variabile con un istogramma, ordinare una pila di istogrammi in modo tale che i valori (le zone della mappa) siano allineati in modo diagonale, per ottenere una tipologia:

testo alternativo

(Fonte: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )


4

Sono molte informazioni ed è un dato di fatto che una singola mappa combinandole tutte in modo tematico comporterebbe una presentazione inutile a causa dell'inquinamento visivo. D'altra parte ci sono 30 zone, quindi anche molte mappe per ciascuna zona comporterebbero inquinamento.

La mia soluzione: scegliere quale sia l'informazione più importante, diciamo "reddito familiare", quindi dividere la mappa in alcune categorie di reddito. E, infine, per ogni punto del reddito, traccia una barra di chat con l'altro 5 attributo.

Con quella mappa è possibile effettuare alcuni confronti come, ad esempio: "Le aree ad alto reddito mostrano sempre un gran numero di lavoratori e un'età media di oltre 21 anni".

Guarda l'esempio...

testo alternativo


4

Forse alcune di queste idee potrebbero aiutare?

Supponendo che tu abbia sei dimensioni:

1: Coropleth : esempio di reddito familiare 0

2, 3 e 4: Simboli : rappresentazione del numero di persone come punti, che consente di vedere lo sfondo: esempio 1, esempio 2 che utilizza la scala di grigi per lavoratori / non lavoratori e una combinazione di colori diversa per mostrare l'età

5: 3D : utilizzo della densità di popolazione come esempio di terreno 3

6: (Non riesco a pensare ad un sesto modo!)

È ridondante mostrare "Numero di famiglie", "Densità della popolazione" e "Numero di persone"?

Sarei scettico se una mappa con questa complessità fosse chiara a chiunque al di fuori di te. Se lo presentassi, prima di tutto mostrerei ogni elemento separatamente, quindi lo aggiungerei in modo che il pubblico possa capire i passaggi.


Un modo alternativo (se non si ha spazio per un grafico radar per ciascuna zona, potrebbe essere quello di creare un "glifo" che rappresenti questo esempio di informazione 4, fig . 10.28 . Penso che questi siano solitamente difficili da capire e non facili da progettare chiaramente, ma l'esempio collegato potrebbe essere usato in questo caso.


Un altro pensiero che avevo, sarebbe stato quello di estrudere i poligoni alla stessa altezza per ciascun poligono e quindi utilizzare una sezione dell'altezza per rappresentare questi parametri. Simile alla creazione di un grafico a barre per ogni area, ma in cui ogni sezione è sovrapposta a intervalli simili. Questo dovrebbe essere visto dal 3D, il che significherebbe che parte di esso sarebbe oscurato.


Adoro e intendo tutti i tuoi suggerimenti. Ho intenzione di implementare 1-> 4. Tuttavia, per la roba 3d: trovo che quando fai mappe 3d, le aree del centro, di solito in posizione centrale ottengono la maggior parte dell'elevazione, bloccando molte zone dietro di loro
dassouki,

@dassouki - Sono d'accordo che di solito è il caso. Forse potresti usare una variabile che non ha un intervallo enorme per questo (età media?) O, in caso affermativo, potresti trasformarla logaritmicamente.
djq

3
@celenius Interessante domanda sulla possibile ridondanza: la densità di popolazione è il numero di persone rispetto all'area ; il numero di persone è un conteggio assoluto ; e il numero di famiglie fornisce informazioni su come le persone vivono insieme. Sebbene chiaramente queste tre variabili siano correlate (e possano creare problemi di quasi collinearità nelle regressioni), in realtà sono tre diverse informazioni. A proposito, è "coropleth". (Fortunatamente Google riconosce questo errore di battitura e fa comunque la ricerca prevista.)
whuber

1
@whuber - Penso che probabilmente sia stato fatto usando il flash (purtroppo!).
djq

2
Sono molto sospettoso riguardo al suggerimento del 3D. AFAIK nessuno ha dimostrato che il 3D sia molto utilizzabile. Il collegamento con il crimine di San Francisco funziona ma solo perché è molto semplice: sarebbe difficile decifrare un modello più complesso. Non penso che il 3D sia la strada da percorrere in questo caso.
Trevesy,

2

È un compito impegnativo. La mia risposta è andare con una mappa multivariata. Dai un'occhiata a questa mappa . La mappa sembrerà occupata se mostri tutte le variabili su una mappa. Assicurati di selezionare la combinazione di colori appropriata se scegli di utilizzare una mappa multivariata.


Google Docs è bloccato dove lavoro :(
dassouki il


non ha funzionato neanche e non posso cancellarlo se non ha un'estensione di file alla fine di esso
dassouki

Still no go ....
dassouki,

questo è un blocco dalla mia parte. :( Non mi dispiace inviarti la mappa via e-mail.
Raj

0

Un grado di semplificazione sarebbe quello di esprimere un elemento, come la densità di popolazione, attraverso un cartogramma, ovvero distorcere l'area di ciascuna unità in modo che sia proporzionale alla popolazione:

Elezioni presidenziali USA 2008
(fonte: amherst.edu )

Lo svantaggio principale è che lo spettatore deve essere in grado di riconoscere la distorsione delle zone dalle loro "solite" forme.

Maggiori informazioni qui: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
Penso che questo abbia un potenziale, ma non è chiaro quanto bene i cartogrammi possano essere applicati a questa particolare situazione (visualizzando contemporaneamente più attributi nello stesso spazio). In teoria potresti creare molti piccoli cartogrammi multipli, ma può essere difficile da interpretare (perdi la coerenza tra le mappe, che è un po 'essenziale per piccoli multipli). Forse il cartogramma può essere combinato con il colore in modi più interessanti per mostrare più attributi.
Andy W,

1
Un esempio di piccoli cartogrammi multipli, gisandscience.com/2011/12/07/…
Andy W
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.