Voglio ridurre la dimensionalità dei sistemi di ordine superiore e catturare la maggior parte della covarianza su un campo preferibilmente bidimensionale o monodimensionale. Capisco che ciò può essere fatto tramite l'analisi dei componenti principali e ho usato PCA in molti scenari. Tuttavia, non l'ho mai usato con tipi di dati booleani e mi chiedevo se fosse significativo fare PCA con questo set. Quindi, per esempio, fingi di avere metriche qualitative o descrittive e assegno un "1" se quella metrica è valida per quella dimensione e uno "0" se non lo è (dati binari). Quindi, per esempio, fai finta di provare a confrontare i sette nani in Biancaneve. Abbiamo:
Doc, Dopey, Bashful, Grumpy, Sneezy, Sleepy and Happy, e vuoi organizzarli in base alle qualità, e lo hai fatto così:
Quindi, per esempio, Bashful è intollerante al lattosio e non nel tiro dell'onore. Questa è una matrice puramente ipotetica e la mia vera matrice avrà molte colonne più descrittive. La mia domanda è: sarebbe ancora appropriato fare PCA su questa matrice come mezzo per trovare la somiglianza tra gli individui?
a means of finding the similarity between individuals
. Ma questo compito è per un'analisi del cluster, non per PCA.