Quali sono alcune scelte popolari per la visualizzazione di dati a 4 dimensioni?


12

Supponiamo che io abbia i seguenti dati a quattro dimensioni, in cui i primi tre possono essere considerati come coordinate e l'ultimo può essere considerato come un valore.

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

Come visualizzare meglio l'effetto delle prime tre coordinate sull'ultimo valore?

Sono a conoscenza di tre metodi.

Uno è il grafico 3D per le prime tre coordinate con la dimensione dei punti come valore di quattro. Ma non è così facile vedere la tendenza nei dati.

Un altro sta usando una serie di grafici 3D, ognuno dei quali ha una coordinata fissa. inserisci qui la descrizione dell'immagine

Un altro potrebbe essere un cosiddetto "grafico a traliccio" in un reticolo di R. Non certo se è per questo scopo ma sembra così. inserisci qui la descrizione dell'immagine


2
Hai bisogno di un display statico (ad es. Per una carta)?
gung - Ripristina Monica

Risposte:


12

Se i primi tre sono solo coordinate spaziali e i dati sono scarsi, puoi semplicemente fare un grafico a dispersione 3D con punti di dimensioni o colori diversi per il valore.

Assomiglia a questo: (fonte: gatech.edu )spargimento

Se i tuoi dati sono destinati ad essere di natura continua ed esistono su una griglia reticolare, puoi tracciare diversi isoconto dei dati usando Marching Cubes .

Un altro approccio quando si hanno densi dati 4D è quello di visualizzare diverse "sezioni" 2D dei dati incorporati in 3D. Sarà simile a questo:

fette


Il grafico a dispersione 3D colorato è davvero adatto solo per funzioni continue su dati 3D. Se il gradiente della funzione cambia in modo regolare, è possibile vedere alcuni motivi nella dispersione dei punti. Allo stesso modo la visualizzazione del volume in basso funziona meglio anche in questo scenario. Se la funzione è molto rumorosa, sarà difficile vedere qualcosa. Se hai 4 variabili esplicative (come per fare PCA o clustering) che tracciano 3 in coordinate euclidee e la 4a usando una mappatura non lineare per colorare introducendo una distorsione percettiva, che non può essere quantificata.
Dianne Cook,

@DianneCook è vero. Immagino sia quello che ottengo lavorando sempre con dati volumetrici 3D fluidi e continui;)
mklingen

Ehi, questo è quello che il quesiton ha chiesto% ^)
Dianne Cook il

9

Hai quattro variabili quantitative? In tal caso, prova i tour, i grafici delle coordinate parallele, le matrici scatterplot. Il pacchetto tourr (e tourrGui) in R eseguirà i tour, fondamentalmente la rotazione in dimensioni elevate, puoi scegliere di proiettare in 1D, 2D o più, e c'è un documento JSS che puoi leggere per iniziare citato nel pacchetto. Grafici di coordinate parallele e matrici scatterplot sono nel pacchetto GGally, anche le matrici scatterplot sono nel pacchetto YaleToolkit. Puoi anche guardare il http://www.ggobi.org per video e altra documentazione su tutti questi.

Se i tuoi dati sono completamente categorici, dovresti usare i diagrammi a mosaico o le varianti. Dai un'occhiata al pacchetto di grafici di prodotto in R, anche vcd ha alcune funzioni ragionevoli, o il pacchetto ggparallel per fare l'equivalente di grafici di coordinate parallele per dati categorici. Inoltre, ho appena scoperto che il pacchetto extracat ha alcune funzioni per la visualizzazione di dati categorici.

Ho letto male la domanda, in origine, perché mi sono fermato alla domanda e ho trascurato di leggere la descrizione completa. Simile all'approccio seguente (punti di colorazione in 3D) è possibile utilizzare la spazzolatura collegata per esplorare le funzioni definite su spazi ad alta dimensione. Guarda qui il video che mostra come farlo per una normale funzione multivariata 3D. Il pennello dipinge i punti con alta densità (valori di funzione elevati) e quindi passa ai valori di densità inferiore e inferiore (valori di funzione bassi). Le posizioni in cui viene campionata la funzione sono mostrate in un grafico a dispersione rotante 3D, utilizzando il tour, che potrebbe essere utilizzato per esaminare anche domini di dimensioni 4, 5 o superiori.


2

Prova le facce di Chernoff . L'idea è di collegare le variabili alle caratteristiche del viso. Ad esempio, la dimensione del sorriso sarebbe una variabile, la rotondità del viso è un'altra ecc. Per quanto ridicolo possa sembrare, questo potrebbe effettivamente funzionare se trovi un modo intelligente per mappare le variabili alle caratteristiche.

Un altro modo è mostrare le proiezioni 2D dello schema di fase 3D. Supponiamo che tu abbia x1, x2, x3, x4 le tue variabili. Per ogni valore di x4, disegna un grafico 3-d di punti (x1, x2, x3) e collega i punti. Funziona meglio quando viene ordinato x4, ad es. Data o ora.

AGGIORNAMENTO: puoi anche provare i grafici a bolle. Tre dimensioni usuali x cartesiane x, y, z e la quarta dimensione sarebbero le dimensioni del punto di bolla.

Puoi provare l'animazione, ovvero usare il tempo come quarta dimensione.

Anche una combinazione di bolla e animazione: x, y, bolla e tempo.

Inoltre, correlato a Chernoff è la trama del glifo , che può sembrare un po 'più seria. Sono stelle con lunghezza dei raggi proporzionale ai valori variabili.


Grazie per la risposta. Sembra che la seconda opzione sia possibile per il mio problema. Penso che il primo non sembri così grave per un documento di ricerca. Fondamentalmente vorrei che la trama potesse rivelare qualche tendenza o influenza di tre fattori sul valore (quarta dimensione).
Tyler 傲 来 国 主

5
I volti di Chernoff sono stati usati in ricerche serie, afaik.
Aksakal,

1
Le facce di Chernoff possono essere straordinariamente utili, specialmente quando la dimensionalità è di circa 10-20 variabili. Per quattro dimensioni non sono efficaci quanto altri tipi di rappresentazioni grafiche.
whuber

3
i volti di Chernoff sono un'idea terribile! se devi usare una trama di icone usa una trama. Se hai un set di dati molto piccolo, questi potrebbero essere utili, ma prova a tracciare 1000 icone e vedi se riesci davvero a vedere qualcosa!
Dianne Cook,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.