È sempre meglio estrarre più fattori quando esistono?


11

A differenza dell'analisi dei componenti principali, le soluzioni ai modelli di analisi dei fattori non sono necessariamente nidificate. Cioè, i caricamenti (ad esempio) per il primo fattore non saranno necessariamente identici quando viene estratto solo il primo fattore rispetto a quando lo sono i primi due fattori.

Con questo in mente, considera un caso in cui hai una serie di variabili manifest che sono altamente correlate e (per conoscenza teorica del loro contenuto) dovrebbero essere guidate da un singolo fattore. Immagina che le analisi dei fattori esplorativi (secondo la metrica che preferisci: analisi parallela, grafico a ghiaia, valori di autigeni> 1, ecc.) Suggeriscono fortemente che ci sono fattori: un grande fattore primario e un piccolo fattore secondario. Sei interessato ad usare le variabili manifest e la soluzione del fattore per stimare (cioè ottenere i punteggi dei fattori) i valori dei partecipanti per il primo fattore. In questo scenario, sarebbe meglio:2

  1. Adatta un modello di fattore per estrarre solo fattore e ottenere punteggi di fattori (ecc.), Oppure1
  2. adattare un modello di fattore per estrarre entrambi i fattori, ottenere punteggi dei fattori per i fattori, ma buttare via / ignorare i punteggi per il secondo fattore?

Per quale sia la migliore pratica, perché? C'è qualche ricerca su questo problema?


Non si deve fare affidamento solo sui dispositivi euristici pre-analitici quando si sceglie il numero di fattori da estrarre. Riproduzione di correlazioni (quanto è meglio quando si estraggono 2 fattori anziché 1?) Come vengono distribuiti i residui di correlazione in questa e quelle soluzioni? (normalmente dovrebbero essere uniformi o normali, senza coda destra lunga / grassa). Se i dati sono normali, i test di adattamento e di errore dei carichi sono calcolabili (con estrazione ML). Sulla base di tutto ciò oltre all'interpretazione, si potrebbe decidere se la via (1) o (2) sia migliore nel caso attuale.
ttnphns,

(cont.) Alla fine, solo nuovi campioni / FA di conferma possono giudicare il dilemma fino alla fine. Una nozione, tuttavia. Se il 2 ° fattore è veramente debole (piccoli carichi SS dopo l'estrazione), non mi aspetto che le due soluzioni (e quindi i punteggi dei fattori del fattore 1) differiscano notevolmente. (Lo dico senza troppa fiducia perché sto commentando senza revisione. Ma, logicamente, se il piano dei fattori è pronto a degenerare in linea, i risultati dovrebbero essere quasi come con solo la linea ...)
ttnphns

Il titolo Q Is is always better to extract more factors when they exist?non è molto chiaro. È sempre meglio estrarne quanti ne esistono. L'adattamento insufficiente o l'eccesso di adattamento distorcono entrambi la "vera" struttura latente a causa della natura multivariata e non nidificata dell'analisi menzionata. Il problema è che non sappiamo esattamente quanti fattori ci siano nei nostri dati. E se questi dati hanno tanti quanti ne ha la popolazione.
ttnphns,

1
@ttnphns, il tuo ultimo commento arriva al cuore della domanda, credo. Supponi qualsiasi metodo ti piaccia per convincerti che ci sono davvero 2 fattori, 1 dei quali rappresenta quasi tutta la varianza condivisa, fino a includere CFA su un nuovo campione. La vestibilità w / 2 è trascurabilmente migliore, ma migliore. Questo è un esempio falso e inventato per evidenziare il problema. Il problema di fondo potrebbe anche essere l'utilizzo di 2 su 5.
gung - Reinstate Monica

1
La domanda è, poiché le soluzioni non sono nidificate, quale approccio offre una migliore stima del punteggio di ciascun partecipante sulla variabile latente, e perché? L'uso di solo 1 è distorto, varia ulteriormente rispetto al valore reale o entrambi? Succede perché usare solo 1 è "insufficiente"? Cosa significa esattamente? È possibile caratterizzare la natura della distorsione? In alternativa, mi sarei aspettato che l'estrazione di solo 1 consentisse all'analisi di focalizzare tutti i suoi gradi di libertà sull'ottenere il primo più preciso possibile.
gung - Ripristina Monica

Risposte:


5

Il problema a cui alludi è l'argomento della "unidimensionalità approssimativa" quando si costruiscono strumenti di test psicologici, che è stato discusso un po 'nella lituratura negli anni '80. L'ispirazione esisteva in passato perché i praticanti volevano utilizzare i modelli IRT (item response response theory) tradizionali per i loro oggetti, e all'epoca questi modelli IRT erano limitati esclusivamente alla misurazione di tratti unidimensionali. Quindi, si sperava che il test multidimensionale fosse un fastidio che (si spera) potesse essere evitato o ignorato. Questo è anche ciò che ha portato alla creazione delle tecniche di analisi parallele nell'analisi fattoriale (Drasgow e Parsons, 1983) e dei metodi DETECT.

Le conseguenze dell'ignorare tratti / fattori aggiuntivi, oltre ad adattare ovviamente il modello errato ai dati (ovvero ignorare le informazioni sul potenziale disadattamento del modello; sebbene possa ovviamente essere banale), è che le stime dei tratti sul fattore dominante diventeranno distorte e quindi meno efficiente. Queste conclusioni dipendono ovviamente da come le proprietà dei tratti aggiuntivi (ad esempio, sono correlate alla dimensione primaria, hanno carichi forti, quanti carichi incrociati ci sono, ecc.), Ma il tema generale è che le stime secondarie per ottenere punteggi dei tratti primari sarà meno efficace. Vedere la relazione tecnica qui per un confronto tra un modello unidimensionale montato in modo errato e un modello a due fattori; il rapporto tecnico sembra essere esattamente quello che stai cercando.

Da un punto di vista pratico, l'utilizzo di criteri informativi può essere utile quando si seleziona il modello più ottimale, nonché statistiche di adattamento del modello in generale (RMSEA, CFI, ecc.) Poiché le conseguenze dell'ignorare l'informazione multidimensionale influenzeranno negativamente l'adattamento globale ai dati . Ma, naturalmente, l'adattamento globale del modello è solo un'indicazione dell'utilizzo di un modello inappropriato per i dati a portata di mano; è del tutto possibile che vengano utilizzate forme funzionali improprie, come la non linearità o la mancanza di monotonicità, quindi anche i rispettivi elementi / variabili devono sempre essere controllati.

Vedi anche :

Drasgow, F. e Parsons, CK (1983). Applicazione di modelli di teoria di risposta di oggetti unidimensionali a dati multidimensionali. Misurazione psicologica applicata, 7 (2), 189-199.

Drasgow, F. & Lissak, RI (1983). Analisi parallele modificate: una procedura per esaminare la dimensionalità latente delle risposte degli oggetti con punteggio dicotomico. Journal of Applied Psychology, 68, 363-373.

Levent Kirisci, Tse-chi Hsu e Lifa Yu (2001). Robustezza dei programmi di stima dei parametri degli articoli rispetto alle ipotesi di unidimensionalità e normalità. Misura psicologica applicata, 25 (2), 146-162.


Grazie per averlo aggiunto. Questo sembra essere proprio quello che sto cercando.
gung - Ripristina Monica

Comprendo correttamente che la tua risposta alla domanda sul titolo è "Sì"?
ameba dice di reintegrare Monica l'

2
@amoeba in generale, direi di sì, o più che includere le informazioni extra dovrebbe fare altrettanto o meglio che imporre una rigida unidimensionalità. Ignorare la multidimensionalità nota può essere molto problematico, ma ovviamente un certo numero di fattori contribuirà a questo. L'unica volta in cui le informazioni extra sulla struttura potrebbero essere cattive è quando la dimensione del campione è troppo piccola per stimare stabilmente i parametri extra; quindi, compromesso di bias-efficienza. Ma, se la dimensione del campione non è un grosso problema, direi che c'è poco da perdere includendo informazioni extra (ma molto da perdere in caso contrario).
Philchalmers,

1

Se davvero non vuoi usare il secondo fattore, dovresti semplicemente usare un modello a un fattore. Ma sono perplesso dalla tua osservazione che i caricamenti per il primo fattore cambieranno se usi un secondo fattore.

Affrontiamo prima questa affermazione. Se si utilizzano i componenti principali per estrarre i fattori e non si utilizza la rotazione dei fattori, i caricamenti non cambieranno - soggetto forse al ridimensionamento (o al completo capovolgimento: se è un fattore, allora è un modo legittimo per esprimerlo come bene). Se si utilizza la massima probabilità di estrazione e / o rotazione dei fattori, i caricamenti possono dipendere dal numero di fattori estratti.- xxx

Successivamente, per la spiegazione degli effetti delle rotazioni. Non sono bravo a disegnare, quindi cercherò di convincerti ad usare le parole. Presumo che i tuoi dati siano (approssimativamente) normali, quindi anche i punteggi dei fattori siano approssimativamente normali. Se si estrae un fattore, si ottiene una distribuzione normale unidimensionale, se si estraggono due fattori, si ottiene una distribuzione normale bivariata.

La densità di una distribuzione bivariata sembra approssimativamente parlare come un cappello, ma la forma esatta dipende dal ridimensionamento e dal coefficiente di correlazione. Supponiamo quindi che i due componenti abbiano ciascuno una varianza unitaria. Nel caso non correlato, ottieni un bel sombrero, con curve di livello che sembrano cerchi. Una foto è qui . La correlazione "schiaccia" il cappello, in modo che assomigli di più a un cappello di Napoleone .

Supponiamo che il tuo set di dati originale avesse tre dimensioni e vuoi estrarne due fattori. Atteniamoci anche alla normalità. In questo caso la densità è un oggetto quadridimensionale, ma le curve di livello sono tridimensionali e possono almeno essere visualizzate. Nel caso non correlato le curve di livello sono sferiche (come un pallone da calcio). In presenza di correlazione, le curve di livello saranno nuovamente distorte, in un pallone da calcio, probabilmente sottoinfiammato, in modo che lo spessore delle cuciture sia inferiore allo spessore nelle altre direzioni.

Se si estraggono due fattori utilizzando PCA, si appiattisce completamente il calcio in un'ellisse (e si proietta ogni punto dati sul piano dell'ellisse). Il primo fattore non ruotato corrisponde all'asse lungo dell'ellisse, il secondo fattore è perpendicolare ad esso (ovvero l'asse corto). La rotazione quindi sceglie un sistema di coordinate all'interno di questa ellisse per soddisfare alcuni altri criteri utili.

Se si estrae solo un singolo fattore, la rotazione è impossibile, ma si garantisce che il fattore PCA estratto corrisponda all'asse lungo dell'ellisse.


2
Sono perplesso da questa risposta. La domanda si pone esplicitamente sull'analisi fattoriale, anziché sull'analisi delle componenti principali.
ameba dice di reintegrare Monica l'

Esistono due modi per estrarre i fattori: componenti principali o massima probabilità. Non ho fatto alcuna statistica su questo, ma credo che il metodo del componente principale sia usato più spesso.
user3697176

3
Esistono molti metodi diversi, più di due. Asse principale, ML, minuti, minimi quadrati ponderati e altro - Non sono un esperto qui. La PCA è forse a volte (raramente!) Anche considerata un metodo di estrazione dei fattori, ma è piuttosto sciatta - in realtà non dovrebbe esserlo. Si adatta a un modello diverso.
ameba dice di reintegrare Monica l'

La tua prima frase è indirizzata al mio Q. Sarebbe bello saperne di più e perché potrebbe essere giusto. Per quanto riguarda i metodi per estrarre i fattori, @amoeba ha ragione: PCA e PAF erano comuni quando altri algoritmi non erano altrettanto sviluppati o difficili da implementare. Ora sono ampiamente considerati inferiori. Ad fa()esempio R non li usa da anni. Altri metodi produrranno soluzioni non nidificate, che è facile da verificare con software e un set di dati FA. Per motivi di comparabilità, è possibile considerare entrambe le soluzioni non ruotate. FWIW, ho familiarità con l'idea di distribuzioni MVN sferiche ed ellittiche.
gung - Ripristina Monica

1
@gung, un'osservazione. Il metodo PAF fornisce anche soluzioni non nidificate. È un metodo FA in buona fede (anche se basato su PCA come metodo) e, suppongo, è ancora ampiamente usato.
ttnphns,

1

Perché non utilizzare qualcosa come lavaan o MPlus per eseguire due modelli (modello unidimensionale e un modello a due dimensioni allineato ai risultati EFA) e confrontare gli indici di adattamento relativo e assoluto dei diversi modelli (ad esempio, criteri di informazione - AIC e BIC, RMSEA, SRMR, CFI / TLI)? Nota che se percorri questa strada non vorrai usare PCA per l'EFA, ma piuttosto i principali fattori. Qualcuno veramente interessato alla misurazione incorporerebbe il CFA in un modello di equazione strutturale completo.

Modifica: l'approccio che ti sto chiedendo di considerare riguarda di più il numero di variabili latenti che spiegano effettivamente l'insieme di elementi. Se si desidera ottenere la migliore stima del fattore più grande, voterei per l'utilizzo dei punteggi dei fattori del modello CFA con l'adattamento migliore, qualunque sia.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.