Analisi fattoriale di questionari composti da articoli Likert


17

Analizzavo gli articoli da un punto di vista psicometrico. Ma ora sto cercando di analizzare altri tipi di domande sulla motivazione e altri argomenti. Queste domande sono tutte sulle scale Likert. Il mio pensiero iniziale era di utilizzare l'analisi dei fattori, perché si ipotizza che le domande riflettano alcune dimensioni sottostanti.

  • Ma l'analisi dei fattori è appropriata?
  • È necessario convalidare ogni domanda relativa alla sua dimensionalità?
  • C'è un problema con l'esecuzione dell'analisi fattoriale su articoli simili?
  • Esistono buoni documenti e metodi su come condurre analisi dei fattori su Likert e altri articoli categorici?

Se capisco correttamente, la tua domanda comprende almeno due diversi argomenti: (1) uso della FA in atteggiamento o scale motivazionali e (2) come gestire schemi di risposta "estremi" (effetti soffitto / pavimento) in tali scale?
CHL

Risposte:


22

Da quello che ho visto finora, la FA è usata per gli oggetti d'atteggiamento così come per altri tipi di scale di valutazione. Il problema derivante dalla metrica utilizzata (vale a dire "le scale di Likert devono davvero essere trattate come scale numeriche?" È un dibattito di lunga data, ma fornendoti la verifica della distribuzione della risposta a forma di campana puoi gestirle come misurazioni continue, in caso contrario, verificare la presenza di modelli FA non lineari o il ridimensionamento ottimale ) può essere gestito da modelli IRT politomici, come la risposta graduata, la scala di rating o il modello di credito parziale. Questi ultimi due possono essere usati come un controllo approssimativo se le distanze di soglia, come usate in articoli di tipo Likert, sono una caratteristica del formato di risposta (RSM) o dell'articolo particolare (PCM).

Per quanto riguarda il tuo secondo punto, è noto, ad esempio, che le distribuzioni di risposta nelle indagini sull'atteggiamento o sulla salute differiscono da un paese all'altro (ad esempio, i cinesi tendono ad evidenziare modelli di risposta "estremi" rispetto a quelli provenienti dai paesi occidentali, vedi ad esempio Song , X.-Y. (2007) Analisi di modelli di equazioni strutturali multisample con applicazioni ai dati sulla qualità della vita, nel Manuale delle variabili latenti e modelli correlati , Lee, S.-Y. (Ed.), Pp. 279-302, Nord -Olanda). Alcuni metodi per gestire tale situazione dalla cima della mia testa:

  • utilizzo di modelli log-lineari (approccio marginale) per evidenziare un forte squilibrio tra i gruppi a livello di elemento (i coefficienti vengono quindi interpretati come rischi relativi anziché probabilità);
  • il metodo SEM multi-campione di Song sopra citato (Non so se funzionano ulteriormente su quell'approccio, però).

Ora, il punto è che la maggior parte di questi approcci si concentra a livello di oggetto (effetto soffitto / pavimento, diminuzione dell'affidabilità, statistiche di adattamento degli oggetti sbagliate, ecc.), Ma quando si è interessati a come le persone si discostano da ciò che ci si aspetterebbe da un ideale insieme di osservatori / intervistati, penso che dobbiamo invece concentrarci sugli indici di adattamento della persona.

χ2

Come proposto da Eid e Zickar (2007), combinando un modello di classe latente (per isolare un gruppo di intervistati, ad esempio quelli che rispondono sempre alle categorie estreme rispetto agli altri) e un modello IRT (per stimare i parametri degli oggetti e le posizioni delle persone sul latente tratto in entrambi i gruppi) sembra una buona soluzione. Altre strategie di modellizzazione sono descritte nel loro documento (ad es. Modello HYBRID, vedi anche Holden e Book, 2009).

Allo stesso modo, i modelli di sviluppo possono essere utilizzati per far fronte allo stile di risposta , che è definito come un modello coerente e indipendente dal contenuto della categoria di risposta (ad es. Tendenza ad essere d'accordo con tutte le affermazioni). Nelle scienze sociali o nella letteratura psicologica, questo è noto come Extreme Response Style (ERS). I riferimenti (1–3) possono essere utili per avere un'idea di come si manifesta e di come può essere misurato.

Ecco un breve elenco di articoli che possono aiutare a progredire su questo argomento:

  1. Hamilton, DL (1968). Attributi della personalità associati a uno stile di risposta estremo . Bollettino psicologico , 69 (3) : 192–203.
  2. Greanleaf, EA (1992). Misurazione di uno stile di risposta estremo. Quaterly di opinione pubblica , 56 (3) : 328-351.
  3. de Jong, MG, Steenkamp, ​​J.-BEM, Fox, J.-P. e Baumgartner, H. (2008). Utilizzo della teoria della risposta agli oggetti per misurare lo stile di risposta estrema nella ricerca di mercato: un'indagine globale. Journal of marketing research , 45 (1) : 104-115.
  4. Morren, M., Gelissen, J. e Vermunt, JK (2009). Trattare con uno stile di risposta estremo nella ricerca interculturale: un approccio limitato all'analisi dei fattori di classe latente
  5. Moors, G. (2003). Diagnosi del comportamento dello stile di risposta in base a un approccio basato su un fattore di classe latente. Correlati socio-demografici del ruolo di genere Atteggiamenti e percezioni della discriminazione etnica riesaminata. Qualità e quantità , 37 (3), 277-302.
  6. de Jong, MG Steenkamp JB, Fox, J.-P. e Baumgartner, H. (2008). Teoria della risposta agli oggetti per misurare lo stile di risposta estrema nella ricerca di mercato: un'indagine globale. Journal of Marketing Research , 45 (1), 104-115.
  7. Javaras, KN ​​e Ripley, BD (2007). Un modello di variabile latente "dispiegabile" per i dati di atteggiamento Likert. JASA , 102 (478): 454-463.
  8. diapositive da Moustaki, Knott e Mavridis, Metodi per rilevare valori anomali in modelli variabili latenti
  9. Eid, M. e Zickar, MJ (2007). Rilevamento di stili di risposta e falsificazione di personalità e valutazioni organizzative da Mixed Rasch Models. In von Davier, M. e Carstensen, CH (Eds.), Modelli Rasch di distribuzione multivariata e di miscele , pp. 255–270, Springer.
  10. Holden, RR e Book, AS (2009). Utilizzo della modellazione ibrida di classe latente di Rasch per migliorare il rilevamento di falsi in un inventario della personalità. Personalità e differenze individuali , 47 (3) : 185-190.

Collegamenti interrotti per Hamilton (1968) e Morren, Gelissen e Vermunt (2009) ... che schifo! Non è stato possibile trovare fonti alternative con Google Scholar (non ho ancora provato il vecchio Google normale).
Nick Stauner,

13

L'analisi fattoriale esplorativa (EFA) è appropriata (psicometricamente e in altro modo) per esaminare in che misura si possano spiegare le correlazioni tra più elementi deducendo l'influenza comune di (a) fattore (i) non misurato (cioè latente). Se questo non è il tuo intento specifico, prendi in considerazione analisi alternative, ad esempio:

  • Modellazione lineare generale (ad es. Regressione multipla, correlazione canonica o (M) AN (C) OVA)
  • Analisi del fattore di conferma (CFA) o analisi del tratto / classe / profilo latente
  • Equazione strutturale (SEM) / modellazione dei minimi quadrati parziali

La dimensionalità è il primo problema che EFA può affrontare. È possibile esaminare gli autovalori della matrice di covarianza (come producendo un diagramma ghiaione tramite EFA) e condurre un'analisi parallela per risolvere la dimensionalità delle misure. (Vedi anche alcuni ottimi consigli e suggerimenti alternativi da William Revelle .) Dovresti farlo attentamente prima di estrarre un numero limitato di fattori e ruotarli in EFA, o prima di adattare un modello con un numero specifico di fattori latenti usando CFA, SEM o il simile. Se un'analisi parallela indica la multidimensionalità, ma il tuo (primo) fattore generale supera di gran lunga tutti gli altri (vale a dire, ha di gran lunga il più grande autovalore / spiega la maggior parte della varianza nelle tue misure), prendi in considerazione l'analisi dei bifattori (Gibbons & Hedeker, 1992;Reise, Moore e Haviland, 2010 ) .

Molti problemi sorgono nell'EFA e nella modellazione a fattore latente dei rating della scala Likert. Le scale Likert producono dati ordinali (cioè categorici, politomici, ordinati), non dati continui. L'analisi fattoriale generalmente presuppone che qualsiasi input di dati grezzi sia continuo e le persone spesso conducono analisi fattoriali di matrici di correlazioni momento-prodotto di Pearson, che sono appropriate solo per dati continui. Ecco una citazione di Reise e colleghi (2010) :

Le tecniche analitiche di fattore di conferma ordinarie non si applicano ai dati dicotomici o politomici (Byrne, 2006) . Sono invece necessarie speciali procedure di stima (Wirth & Edwards, 2007) . Esistono fondamentalmente tre opzioni per lavorare con i dati di risposta degli articoli politomici. Il primo è calcolare una matrice policorica e quindi applicare metodi analitici a fattore standard (vedi Knol & Berger, 1991) . Una seconda opzione è quella di utilizzare l'analisi fattoriale completa di informazioni (Gibbons & Hedeker, 1992) . Il terzo consiste nell'utilizzare procedure di stima delle informazioni limitate progettate specificamente per i dati ordinati come minimi quadrati ponderati con aggiustamento di media e varianza (MPLUS; Muthén & Muthén, 2009) .

Consiglierei di combinare il primo e il terzo approccio (ovvero, utilizzare la stima dei minimi quadrati ponderati diagonalmente su una matrice di correlazione policorica), basata sulla discussione di Wang e Cunningham (2005) sui problemi con alternative tipiche:

Quando l'analisi dei fattori di conferma è stata condotta con dati ordinali non normali utilizzando la massima probabilità e sulla base delle correlazioni del momento-prodotto di Pearson, le stime dei parametri al ribasso prodotte in questo studio erano coerenti con i risultati di Olsson (1979) . In altre parole, l'entità della non-anomalia nelle variabili ordinali osservate è un fattore determinante per l'accuratezza delle stime dei parametri.

I risultati supportano anche i risultati di Babakus, et al. (1987) . Quando viene utilizzata la stima della massima verosimiglianza con una matrice di input di correlazione policorica nelle analisi dei fattori di conferma, le soluzioni tendono a dare valori chi-quadrato inaccettabili e quindi significativi insieme a statistiche inadeguate.

Resta da stabilire se i ricercatori debbano utilizzare stimatori dei minimi quadrati ponderati o diagonali dei minimi quadrati nella stima di modelli di equazioni strutturali con dati categorici non normali. Né la stima dei minimi quadrati ponderati né i minimi quadrati diagonalmente ponderati fanno ipotesi sulla natura della distribuzione delle variabili ed entrambi i metodi producono risultati asintoticamente validi. Tuttavia, poiché la stima dei minimi quadrati ponderati si basa sui momenti del quarto ordine, questo approccio porta spesso a problemi pratici ed è molto impegnativo dal punto di vista computazionale. Ciò significa che la stima dei minimi quadrati ponderati potrebbe non essere robusta se utilizzata per valutare modelli di medie, ovvero con 10 indicatori, di dimensioni grandi e di dimensioni da piccole a moderate.

Non mi è chiaro se la stessa preoccupazione per la stima dei minimi quadrati ponderati si applichi alla stima DWLS; a prescindere, gli autori raccomandano tale stimatore. Nel caso in cui non hai già i mezzi:

  • R (R Core Team, 2012) è gratuito. 2.15.2Per questi pacchetti avrai bisogno di una versione precedente (ad es. ):
    • Il psychpacchetto (Revelle, 2013) contiene la polychoricfunzione.
      • La fa.parallelfunzione può aiutare a identificare il numero di fattori da estrarre.
    • Il lavaanpacchetto (Rosseel, 2012) offre una stima DWLS per l'analisi delle variabili latenti.
    • Il semToolspacchetto contiene i efaUnrotate, orthRotatee oblqRotatefunzioni.
    • Il mirtpacchetto (Chalmers, 2012) offre alternative promettenti usando la teoria della risposta degli oggetti.

Immagino che anche Mplus (Muthén & Muthén, 1998-2011) funzionerebbe, ma la versione demo gratuita non può ospitare più di sei misurazioni e la versione con licenza non è economica. Potrebbe valerne la pena se te lo puoi permettere; la gente ama Mplus e il servizio clienti dei Muthéns attraverso i loro forum è incredibile!

Come indicato sopra, la stima DWLS supera il problema delle violazioni del presupposto della normalità (sia univariate che multivariate), che è un problema molto comune e quasi onnipresente nei dati di valutazione della scala di Likert. Tuttavia, non è necessariamente un problema pragmaticamente consequenziale; la maggior parte dei metodi non è troppo sensibile alle (fortemente distorte da) piccole violazioni (cfr. Il test della normalità è "essenzialmente inutile"? ). La risposta di @ chl a questa domanda solleva punti e suggerimenti più importanti, eccellenti anche riguardo a problemi con uno stile di risposta estremo; sicuramente un problema con le valutazioni della scala Likert e altri dati soggettivi.


Riferimenti
· Babakus, E., Ferguson, JCE e Jöreskog, KG (1987). La sensibilità dell'analisi del fattore di massima verosimiglianza confermativa alle violazioni della scala di misurazione e ipotesi distributive. Journal of Marketing Research, 24 , 222–228.
· Byrne, BM (2006). Modellazione di equazioni strutturali con EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: un pacchetto di teoria degli oggetti a risposta multidimensionale per l'ambiente R. Journal of Statistical Software, 48 (6), 1–29. Estratto da http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD, & Hedeker, DR (1992). Analisi dei bi-fattori con informazioni complete. Psychometrika, 57 , 423–436.
· Knol, DL e Berger, MPF (1991). Confronto empirico tra analisi fattoriale e modelli multidimensionali di risposta agli oggetti. Ricerca comportamentale multivariata, 26 , 457–477.
· Muthén, LK e Muthén, BO (1998-2011). Mplus user guide (6th ed.). Los Angeles, California: Muthén e Muthén.
· Muthén, LK e Muthén, BO (2009). Mplus (Versione 4.00). [Software per il computer]. Los Angeles, CA: Autore. URL: http://www.statmodel.com .
· Olsson, U. (1979). Stime di massima verosimiglianza per il coefficiente di correlazione policorica. Psychometrika, 44 , 443–460.
·R Core Team. (2012). R: Un linguaggio e un ambiente per il calcolo statistico. Fondazione R per il calcolo statistico, Vienna, Austria. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM e Haviland, MG (2010). Modelli bifattori e rotazioni: esplorare in che misura i dati multidimensionali generano punteggi di scala univoci. Journal of Personality Assessment, 92 (6), 544–559. Estratto da http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: procedure per la personalità e la ricerca psicologica. Northwestern University, Evanston, Illinois, USA. Estratto da http://CRAN.R-project.org/package=psych . Versione = 1.3.2.
· Rosseel, Y. (2012). lavaan: un pacchetto R per la modellazione di equazioni strutturali. Journal of Statistical Software, 48 (2), 1–36. Estratto da http://www.jstatsoft.org/v48/i02/ .
· Wang, WC e Cunningham, EG (2005). Confronto di metodi di stima alternativi nelle analisi dei fattori di conferma del questionario generale sulla salute. Rapporti psicologici, 97 , 3–10.
· Wirth, RJ e Edwards, MC (2007). Analisi del fattore articolo: approcci attuali e direzioni future. Metodi psicologici, 12 , 58–79. Estratto da http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .


(+11) Non so come ho perso la tua risposta!
chl

Ha! Grazie! Questo è stato seduto lì fuori per un po '. Ho pensato che fosse solo un po 'troppo lungo o oscuro, o forse basato su nuovi metodi che erano più controversi di quanto pensassi. Sembra che non sapessi ancora come usare i tag per i nomi utente.
Nick Stauner

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.