Sarei interessato a ricevere suggerimenti su quando utilizzare i " punteggi dei fattori " rispetto alla semplice somma dei punteggi durante la costruzione di scale. Vale a dire metodi "raffinati" su metodi "non raffinati" per la valutazione di un fattore. Da DiStefano et al. (2009; pdf ), enfasi aggiunta:
Esistono due classi principali di metodi di calcolo del punteggio dei fattori: raffinato e non raffinato. I metodi non perfezionati sono procedure cumulative relativamente semplici per fornire informazioni sul posizionamento degli individui nella distribuzione dei fattori. La semplicità si presta ad alcune caratteristiche interessanti, ovvero i metodi non raffinati sono sia facili da calcolare sia da interpretare. Metodi di calcolo raffinati creano punteggi dei fattori usando approcci più sofisticati e tecnici. Sono più esatti e complessi dei metodi non perfezionati e forniscono stime che sono punteggi standardizzati.
A mio avviso, se l'obiettivo è creare una scala che può essere utilizzata in studi e contesti, allora ha senso una semplice somma o un punteggio medio di tutti gli elementi della scala. Ma diciamo che l'obiettivo è valutare gli effetti del trattamento di un programma e l'importante contrasto è all'interno del gruppo campione-trattamento vs controllo. C'è qualche motivo per cui potremmo preferire i punteggi dei fattori per ridimensionare somme o medie?
Per essere concreti sulle alternative, prendi questo semplice esempio:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
They are more exact
Questa enfasi aggiuntiva non dovrebbe distrarci dal fatto che anche i punteggi dei fattori sono inevitabilmente inesatti ("sottodeterminati").
"more exact"
. Tra i punteggi dei fattori calcolati linearmente il metodo di regressione è il più "esatto" nel senso "più correlato con i valori del fattore reale sconosciuti". Quindi sì, più esatto (nell'approccio algebrico lineare), ma non del tutto esatto.