Antefatto: ho chiesto a centinaia di partecipanti al mio sondaggio quanto fossero interessati ad aree selezionate (in cinque punti Likert scala con 1 che indica "non interessato" e 5 che indica "interessato").
Poi ho provato PCA. L'immagine sotto è una proiezione nei primi due componenti principali. I colori sono usati per i sessi e le frecce PCA sono variabili originali (cioè interessi).
Ho notato che:
- I punti (intervistati) sono abbastanza ben separati dal secondo componente.
- Nessun punto freccia rimasto.
- Alcune frecce sono molto più corte di altre.
- Le variabili tendono a formare cluster, ma non osservazioni.
- Sembra che le frecce rivolte verso il basso (ai maschi) siano principalmente interessi dei maschi e le frecce rivolte verso l'alto siano principalmente interessi delle femmine.
- Alcune frecce non puntano né verso il basso né verso l'alto.
Domande: come interpretare correttamente le relazioni tra punti (intervistati), colori (generi) e frecce (variabili)? Quali altre conclusioni sugli intervistati e i loro interessi possono essere estratti da questa trama?
I dati possono essere trovati qui .