Mi sembra che la funzione principale di PCP sia quella di evidenziare gruppi omogenei di individui, o al contrario (nel doppio spazio, per analogia con PCA) specifici schemi di associazione su variabili diverse. Produce un efficace riepilogo grafico di un set di dati multivariato, quando non ci sono troppe variabili. Le variabili vengono ridimensionate automaticamente in un intervallo fisso (in genere, 0–1) che equivale a lavorare con variabili standardizzate (per impedire l'influenza di una variabile sulle altre a causa di problemi di ridimensionamento), ma per un set di dati di dimensioni molto elevate (# di variabili> 10), devi assolutamente guardare altri display, come il diagramma di fluttuazione o la mappa di calore utilizzati negli studi di microarray.
Aiuta a rispondere a domande come:
- ci sono modelli coerenti di punteggi individuali che possono essere spiegati dall'appartenenza a una classe specifica (ad es. differenza di genere)?
- X1X2
Nel seguente diagramma dei dati dell'iride , si vede chiaramente che le specie (qui mostrate in colori diversi) mostrano profili molto discriminanti quando si considera la lunghezza e la larghezza del petalo, o che l' iris setosa (blu) è più omogenea rispetto alla lunghezza del petalo ( cioè la loro varianza è inferiore), per esempio.
Puoi persino usarlo come backend per la classificazione o tecniche di riduzione della dimensione, come PCA. Molto spesso, quando si esegue un PCA, oltre a ridurre lo spazio delle funzionalità si desidera anche evidenziare gruppi di individui (ad esempio, ci sono individui che sistematicamente ottengono un punteggio più alto su una combinazione delle variabili); questo di solito si riduce applicando una sorta di clustering gerarchico sui punteggi dei fattori ed evidenziando l'appartenenza al cluster risultante nello spazio fattoriale (vedere il pacchetto FactoClass R).
Viene anche utilizzato nei clustergrammi ( Visualizzazione di analisi di cluster non gerarchici e gerarchici ) che mira a esaminare come si evolve l'allocazione dei cluster quando si aumenta il numero di cluster (vedere anche Quali criteri di arresto per il clustering gerarchico agglomerativo vengono utilizzati nella pratica? ).
Tali display sono utili anche quando sono collegati ai soliti grafici a dispersione (che per costruzione sono limitati alle relazioni 2D), questo si chiama spazzolatura ed è disponibile nel sistema di visualizzazione dati GGobi o nel software Mondrian .