L'analisi fattoriale esplorativa (EFA) è appropriata (psicometricamente e in altro modo) per esaminare in che misura si possano spiegare le correlazioni tra più elementi deducendo l'influenza comune di (a) fattore (i) non misurato (cioè latente). Se questo non è il tuo intento specifico, prendi in considerazione analisi alternative, ad esempio:
- Modellazione lineare generale (ad es. Regressione multipla, correlazione canonica o (M) AN (C) OVA)
- Analisi del fattore di conferma (CFA) o analisi del tratto / classe / profilo latente
- Equazione strutturale (SEM) / modellazione dei minimi quadrati parziali
La dimensionalità è il primo problema che EFA può affrontare. È possibile esaminare gli autovalori della matrice di covarianza (come producendo un diagramma ghiaione tramite EFA) e condurre un'analisi parallela per risolvere la dimensionalità delle misure. (Vedi anche alcuni ottimi consigli e suggerimenti alternativi da William Revelle .) Dovresti farlo attentamente prima di estrarre un numero limitato di fattori e ruotarli in EFA, o prima di adattare un modello con un numero specifico di fattori latenti usando CFA, SEM o il simile. Se un'analisi parallela indica la multidimensionalità, ma il tuo (primo) fattore generale supera di gran lunga tutti gli altri (vale a dire, ha di gran lunga il più grande autovalore / spiega la maggior parte della varianza nelle tue misure), prendi in considerazione l'analisi dei bifattori (Gibbons & Hedeker, 1992;Reise, Moore e Haviland, 2010 ) .
Molti problemi sorgono nell'EFA e nella modellazione a fattore latente dei rating della scala Likert. Le scale Likert producono dati ordinali (cioè categorici, politomici, ordinati), non dati continui. L'analisi fattoriale generalmente presuppone che qualsiasi input di dati grezzi sia continuo e le persone spesso conducono analisi fattoriali di matrici di correlazioni momento-prodotto di Pearson, che sono appropriate solo per dati continui. Ecco una citazione di Reise e colleghi (2010) :
Le tecniche analitiche di fattore di conferma ordinarie non si applicano ai dati dicotomici o politomici (Byrne, 2006) . Sono invece necessarie speciali procedure di stima (Wirth & Edwards, 2007) . Esistono fondamentalmente tre opzioni per lavorare con i dati di risposta degli articoli politomici. Il primo è calcolare una matrice policorica e quindi applicare metodi analitici a fattore standard (vedi Knol & Berger, 1991) . Una seconda opzione è quella di utilizzare l'analisi fattoriale completa di informazioni (Gibbons & Hedeker, 1992) . Il terzo consiste nell'utilizzare procedure di stima delle informazioni limitate progettate specificamente per i dati ordinati come minimi quadrati ponderati con aggiustamento di media e varianza (MPLUS; Muthén & Muthén, 2009) .
Consiglierei di combinare il primo e il terzo approccio (ovvero, utilizzare la stima dei minimi quadrati ponderati diagonalmente su una matrice di correlazione policorica), basata sulla discussione di Wang e Cunningham (2005) sui problemi con alternative tipiche:
Quando l'analisi dei fattori di conferma è stata condotta con dati ordinali non normali utilizzando la massima probabilità e sulla base delle correlazioni del momento-prodotto di Pearson, le stime dei parametri al ribasso prodotte in questo studio erano coerenti con i risultati di Olsson (1979) . In altre parole, l'entità della non-anomalia nelle variabili ordinali osservate è un fattore determinante per l'accuratezza delle stime dei parametri.
I risultati supportano anche i risultati di Babakus, et al. (1987) . Quando viene utilizzata la stima della massima verosimiglianza con una matrice di input di correlazione policorica nelle analisi dei fattori di conferma, le soluzioni tendono a dare valori chi-quadrato inaccettabili e quindi significativi insieme a statistiche inadeguate.
Resta da stabilire se i ricercatori debbano utilizzare stimatori dei minimi quadrati ponderati o diagonali dei minimi quadrati nella stima di modelli di equazioni strutturali con dati categorici non normali. Né la stima dei minimi quadrati ponderati né i minimi quadrati diagonalmente ponderati fanno ipotesi sulla natura della distribuzione delle variabili ed entrambi i metodi producono risultati asintoticamente validi. Tuttavia, poiché la stima dei minimi quadrati ponderati si basa sui momenti del quarto ordine, questo approccio porta spesso a problemi pratici ed è molto impegnativo dal punto di vista computazionale. Ciò significa che la stima dei minimi quadrati ponderati potrebbe non essere robusta se utilizzata per valutare modelli di medie, ovvero con 10 indicatori, di dimensioni grandi e di dimensioni da piccole a moderate.
Non mi è chiaro se la stessa preoccupazione per la stima dei minimi quadrati ponderati si applichi alla stima DWLS; a prescindere, gli autori raccomandano tale stimatore. Nel caso in cui non hai già i mezzi:
- R (R Core Team, 2012) è gratuito.
2.15.2
Per questi pacchetti avrai bisogno di una versione precedente (ad es. ):
- Il
psych
pacchetto (Revelle, 2013) contiene la polychoric
funzione.
- La
fa.parallel
funzione può aiutare a identificare il numero di fattori da estrarre.
- Il
lavaan
pacchetto (Rosseel, 2012) offre una stima DWLS per l'analisi delle variabili latenti.
- Il
semTools
pacchetto contiene i efaUnrotate
, orthRotate
e oblqRotate
funzioni.
- Il
mirt
pacchetto (Chalmers, 2012) offre alternative promettenti usando la teoria della risposta degli oggetti.
Immagino che anche Mplus (Muthén & Muthén, 1998-2011) funzionerebbe, ma la versione demo gratuita non può ospitare più di sei misurazioni e la versione con licenza non è economica. Potrebbe valerne la pena se te lo puoi permettere; la gente ama Mplus e il servizio clienti dei Muthéns attraverso i loro forum è incredibile!
Come indicato sopra, la stima DWLS supera il problema delle violazioni del presupposto della normalità (sia univariate che multivariate), che è un problema molto comune e quasi onnipresente nei dati di valutazione della scala di Likert. Tuttavia, non è necessariamente un problema pragmaticamente consequenziale; la maggior parte dei metodi non è troppo sensibile alle (fortemente distorte da) piccole violazioni (cfr. Il test della normalità è "essenzialmente inutile"? ). La risposta di @ chl a questa domanda solleva punti e suggerimenti più importanti, eccellenti anche riguardo a problemi con uno stile di risposta estremo; sicuramente un problema con le valutazioni della scala Likert e altri dati soggettivi.
Riferimenti
· Babakus, E., Ferguson, JCE e Jöreskog, KG (1987). La sensibilità dell'analisi del fattore di massima verosimiglianza confermativa alle violazioni della scala di misurazione e ipotesi distributive. Journal of Marketing Research, 24 , 222–228.
· Byrne, BM (2006). Modellazione di equazioni strutturali con EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: un pacchetto di teoria degli oggetti a risposta multidimensionale per l'ambiente R. Journal of Statistical Software, 48 (6), 1–29. Estratto da http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD, & Hedeker, DR (1992). Analisi dei bi-fattori con informazioni complete.
Psychometrika, 57 , 423–436.
· Knol, DL e Berger, MPF (1991). Confronto empirico tra analisi fattoriale e modelli multidimensionali di risposta agli oggetti. Ricerca comportamentale multivariata, 26 , 457–477.
· Muthén, LK e Muthén, BO (1998-2011). Mplus user guide (6th ed.). Los Angeles, California: Muthén e Muthén.
· Muthén, LK e Muthén, BO (2009). Mplus (Versione 4.00). [Software per il computer]. Los Angeles, CA: Autore. URL: http://www.statmodel.com .
· Olsson, U. (1979). Stime di massima verosimiglianza per il coefficiente di correlazione policorica. Psychometrika, 44 , 443–460.
·R Core Team. (2012). R: Un linguaggio e un ambiente per il calcolo statistico. Fondazione R per il calcolo statistico, Vienna, Austria. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM e Haviland, MG (2010). Modelli bifattori e rotazioni: esplorare in che misura i dati multidimensionali generano punteggi di scala univoci. Journal of Personality Assessment, 92 (6), 544–559. Estratto da http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: procedure per la personalità e la ricerca psicologica. Northwestern University, Evanston, Illinois, USA. Estratto da http://CRAN.R-project.org/package=psych . Versione = 1.3.2.
· Rosseel, Y. (2012). lavaan: un pacchetto R per la modellazione di equazioni strutturali. Journal of Statistical Software, 48 (2), 1–36. Estratto da http://www.jstatsoft.org/v48/i02/ .
· Wang, WC e Cunningham, EG (2005). Confronto di metodi di stima alternativi nelle analisi dei fattori di conferma del questionario generale sulla salute. Rapporti psicologici, 97 , 3–10.
· Wirth, RJ e Edwards, MC (2007). Analisi del fattore articolo: approcci attuali e direzioni future. Metodi psicologici, 12 , 58–79. Estratto da http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .