Variabili distorte nell'analisi PCA o dei fattori


9

Voglio fare l'analisi dei componenti principali (analisi dei fattori) su SPSS sulla base di 22 variabili. Tuttavia, alcune delle mie variabili sono molto distorte (l'asimmetria calcolata dagli intervalli SPSS da 2 a 80!).

Quindi, ecco le mie domande:

  1. Devo mantenere le variabili oblique in questo modo o posso trasformare le variabili nell'analisi dei componenti principali? Se sì, come interpreterei i punteggi dei fattori?

  2. Che tipo di trasformazione dovrei fare? log10 o ln?

  3. Inizialmente, il mio KMO (Kaiser – Meyer – Olkin) è 0.413. Molta letteratura raccomanda un minimo di 0,5. Posso ancora eseguire l'analisi dei fattori o devo rimuovere le variabili per portare il mio KMO a 0,5?


5
Una nota: la PCA non è la stessa dell'analisi fattoriale. PCA è un metodo di riduzione dei dati, FA è un tentativo di trovare variabili latenti. Spesso (ma non sempre) danno risultati simili
Peter Flom

Risposte:


9
  1. Il problema dell'asimmetria nella PCA è lo stesso della regressione: la coda più lunga, se è davvero lunga rispetto all'intera gamma della distribuzione, si comporta in realtà come un grande outlier - tira fortemente la linea di adattamento (componente principale nel tuo caso) verso stesso perché la sua influenza è migliorata; la sua influenza è migliorata perché è così lontana dalla media. Nel contesto della PCA, consentire variabili molto distorte è abbastanza simile a fare PCA senza centrare i dati (cioè fare PCA sulla base della matrice del coseno piuttosto che della matrice di correlazione). E ' lei che decide se permettere la lunga coda ai risultati influenza così grandemente (e lasciare che siano i dati) o meno (e trasformare i dati). Il problema non è collegato al modo in cui interpretate i caricamenti.

  2. Come desidera.

  3. KMO è un indice che indica se le correlazioni parziali sono ragionevolmente piccole per inviare dati all'analisi fattoriale. Perché nell'analisi fattoriale generalmente prevediamo che un fattore carichi più di due sole variabili. Il tuo KMO è abbastanza basso. Puoi renderlo migliore se cadi dalle variabili di analisi con valori KMO individuali bassi (questi formano la diagonale della matrice anti-immagine , puoi richiedere di mostrare questa matrice nella procedura del fattore SPSS). Trasformare le variabili in KMO meno inclinati può recuperare KMO? Chissà. Può essere. Si noti che KMO è importante soprattutto nel modello di analisi dei fattori, non nel modello di analisi dei componenti principali: in FA si adattano correlazioni a coppie, mentre in PCA non lo si fa.


2

Da +1 a @ttnphns, voglio solo espandere un po 'il punto 2. Le trasformazioni vengono spesso utilizzate per stabilizzare l'inclinazione. Come sottolinea @ttnphns, li useresti prima di eseguire le tue analisi. Le trasformazioni dei tronchi fanno parte della famiglia di trasformazioni di potenza Box-Cox. Dovrai prendere in considerazione una gamma più ampia di possibili trasformazioni rispetto ai soli registri (ad esempio, radice quadrata, reciproco, ecc.). La scelta tra diverse basi logaritmiche non ha alcun effetto sulla forza della trasformazione. Quando le persone lavoreranno matematicamente con la variabile trasformata, a volte sono preferiti i log naturali, poiché in alcuni casi il log naturale può rendere la matematica più pulita. Se non ti interessa, potresti scegliere una base che faciliterà l'interpretazione. Cioè, ogni aumento di unità nella nuova scala rappresenterà una base- aumento della scala originale (ad es. se si utilizzava la base di registro 2, quindi ogni unità sarebbe un aumento di 2 volte, la base 10 significa che ogni unità sarebbe un aumento di 10 volte, ecc.), quindi può essere piacevole per scegliere una base tale che i tuoi dati si estenderanno su più unità nella scala trasformata.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.