Una semplice spiegazione per il grafico delle coordinate parallele


13

Ho letto e visto molti grafici di coordinate parallele. Qualcuno può rispondere alla seguente serie di domande:

  1. Cosa sono i grafici di coordinate parallele (PCP) in parole semplici, in modo che un profano possa capire?
  2. Una spiegazione matematica con qualche intuizione, se possibile
  3. Quando sono utili i PCP e quando usarli?
  4. Quando i PCP non sono utili e quando dovrebbero essere evitati?
  5. Possibili vantaggi e svantaggi del PCP

Grande argomento - Riceverai molti +1 per questa domanda ...
Tal Galili,

1
@Tal .. grazie :-) Ma volevo saperne di più ed eventualmente ampliare l'articolo Wiki, che non è troppo informativo.
suncoolsu,

Grande incentivo :)
Tal Galili,

Risposte:


6

Mi sembra che la funzione principale di PCP sia quella di evidenziare gruppi omogenei di individui, o al contrario (nel doppio spazio, per analogia con PCA) specifici schemi di associazione su variabili diverse. Produce un efficace riepilogo grafico di un set di dati multivariato, quando non ci sono troppe variabili. Le variabili vengono ridimensionate automaticamente in un intervallo fisso (in genere, 0–1) che equivale a lavorare con variabili standardizzate (per impedire l'influenza di una variabile sulle altre a causa di problemi di ridimensionamento), ma per un set di dati di dimensioni molto elevate (# di variabili> 10), devi assolutamente guardare altri display, come il diagramma di fluttuazione o la mappa di calore utilizzati negli studi di microarray.

Aiuta a rispondere a domande come:

  • ci sono modelli coerenti di punteggi individuali che possono essere spiegati dall'appartenenza a una classe specifica (ad es. differenza di genere)?
  • X1X2

Nel seguente diagramma dei dati dell'iride , si vede chiaramente che le specie (qui mostrate in colori diversi) mostrano profili molto discriminanti quando si considera la lunghezza e la larghezza del petalo, o che l' iris setosa (blu) è più omogenea rispetto alla lunghezza del petalo ( cioè la loro varianza è inferiore), per esempio.

testo alternativo

Puoi persino usarlo come backend per la classificazione o tecniche di riduzione della dimensione, come PCA. Molto spesso, quando si esegue un PCA, oltre a ridurre lo spazio delle funzionalità si desidera anche evidenziare gruppi di individui (ad esempio, ci sono individui che sistematicamente ottengono un punteggio più alto su una combinazione delle variabili); questo di solito si riduce applicando una sorta di clustering gerarchico sui punteggi dei fattori ed evidenziando l'appartenenza al cluster risultante nello spazio fattoriale (vedere il pacchetto FactoClass R).

Viene anche utilizzato nei clustergrammi ( Visualizzazione di analisi di cluster non gerarchici e gerarchici ) che mira a esaminare come si evolve l'allocazione dei cluster quando si aumenta il numero di cluster (vedere anche Quali criteri di arresto per il clustering gerarchico agglomerativo vengono utilizzati nella pratica? ).

Tali display sono utili anche quando sono collegati ai soliti grafici a dispersione (che per costruzione sono limitati alle relazioni 2D), questo si chiama spazzolatura ed è disponibile nel sistema di visualizzazione dati GGobi o nel software Mondrian .


4

Per quanto riguarda le domande 3, 4 e 5, ti suggerisco di dare un'occhiata a questo lavoro

Schemi di percezione in coordinate parallele: determinazione delle soglie per l'identificazione delle relazioni di: Jimmy Johansson, Camilla Forsell, Mats Lind, Matthew Cooper in Information Visualization, Vol. 7, n. 2. (2008), pagg. 152-162.

Per riassumere i loro risultati, le persone sono d'accordo nell'identificare la direzione della pendenza della relazione tra ciascun nodo, ma non sono così bravi a identificare la forza della relazione o il grado della pendenza. Forniscono livelli di rumore suggeriti in cui le persone possono ancora decifrare la relazione nell'articolo. Sfortunatamente l'articolo non tratta dell'identificazione dei sottogruppi tramite il colore come dimostra chl.


4

Visitare il sito http://www.cs.tau.ac.il/~aiisreal/ e guardare anche il nuovo libro

Coordinate parallele - Questo libro tratta della visualizzazione, incorporando sistematicamente il fantastico riconoscimento del modello umano nel processo di risoluzione dei problemi ... www.springer.com/math/cse/book/978-0-387-21507-5.

Nel cap. 10 ci sono molti esempi reali con dati multivariati che mostrano come utilizzare coordinate parallele (abbr. || -cs). Vale anche la pena imparare alcuni dei calcoli matematici per visualizzare e lavorare con relazioni (superfici) multivariate / multidimensionali e non solo set di punti. È divertente vedere e lavorare con gli analoghi di oggetti familiari in molte dimensioni, ad esempio striscia di Moebius, set convessi e altro ancora.

In breve, i ||-c sono un sistema di coordinate multidimensionale in cui gli assi sono paralleli tra loro consentendo di vedere molti assi. La metodologia è stata applicata agli algoritmi di risoluzione dei conflitti in Controllo del traffico aereo, Computer Vision, Controllo di processo e Supporto decisionale.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.