A differenza dell'analisi dei componenti principali, le soluzioni ai modelli di analisi dei fattori non sono necessariamente nidificate. Cioè, i caricamenti (ad esempio) per il primo fattore non saranno necessariamente identici quando viene estratto solo il primo fattore rispetto a quando lo sono i primi due fattori.
Con questo in mente, considera un caso in cui hai una serie di variabili manifest che sono altamente correlate e (per conoscenza teorica del loro contenuto) dovrebbero essere guidate da un singolo fattore. Immagina che le analisi dei fattori esplorativi (secondo la metrica che preferisci: analisi parallela, grafico a ghiaia, valori di autigeni> 1, ecc.) Suggeriscono fortemente che ci sono fattori: un grande fattore primario e un piccolo fattore secondario. Sei interessato ad usare le variabili manifest e la soluzione del fattore per stimare (cioè ottenere i punteggi dei fattori) i valori dei partecipanti per il primo fattore. In questo scenario, sarebbe meglio:
- Adatta un modello di fattore per estrarre solo fattore e ottenere punteggi di fattori (ecc.), Oppure
- adattare un modello di fattore per estrarre entrambi i fattori, ottenere punteggi dei fattori per i fattori, ma buttare via / ignorare i punteggi per il secondo fattore?
Per quale sia la migliore pratica, perché? C'è qualche ricerca su questo problema?
Is is always better to extract more factors when they exist?
non è molto chiaro. È sempre meglio estrarne quanti ne esistono. L'adattamento insufficiente o l'eccesso di adattamento distorcono entrambi la "vera" struttura latente a causa della natura multivariata e non nidificata dell'analisi menzionata. Il problema è che non sappiamo esattamente quanti fattori ci siano nei nostri dati. E se questi dati hanno tanti quanti ne ha la popolazione.