Somma dei punteggi di valutazione rispetto ai punteggi dei fattori stimati?


12

Sarei interessato a ricevere suggerimenti su quando utilizzare i " punteggi dei fattori " rispetto alla semplice somma dei punteggi durante la costruzione di scale. Vale a dire metodi "raffinati" su metodi "non raffinati" per la valutazione di un fattore. Da DiStefano et al. (2009; pdf ), enfasi aggiunta:

Esistono due classi principali di metodi di calcolo del punteggio dei fattori: raffinato e non raffinato. I metodi non perfezionati sono procedure cumulative relativamente semplici per fornire informazioni sul posizionamento degli individui nella distribuzione dei fattori. La semplicità si presta ad alcune caratteristiche interessanti, ovvero i metodi non raffinati sono sia facili da calcolare sia da interpretare. Metodi di calcolo raffinati creano punteggi dei fattori usando approcci più sofisticati e tecnici. Sono più esatti e complessi dei metodi non perfezionati e forniscono stime che sono punteggi standardizzati.

A mio avviso, se l'obiettivo è creare una scala che può essere utilizzata in studi e contesti, allora ha senso una semplice somma o un punteggio medio di tutti gli elementi della scala. Ma diciamo che l'obiettivo è valutare gli effetti del trattamento di un programma e l'importante contrasto è all'interno del gruppo campione-trattamento vs controllo. C'è qualche motivo per cui potremmo preferire i punteggi dei fattori per ridimensionare somme o medie?

Per essere concreti sulle alternative, prendi questo semplice esempio:

library(lavaan)
library(devtools)

# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
  gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
  source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
  head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1  3  4  3  4  3  3  4  4  3
# 2  2  1  2  2  4  3  2  1  3
# 3  1  3  4  4  4  2  1  2  2
# 4  1  2  1  2  1  2  1  3  2
# 5  3  3  4  4  1  1  2  4  1
# 6  2  2  2  2  2  2  1  1  1

# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf

# non-refined -----------------------------------------------------------------
  mydata$sumScore <- rowSums(mydata[, 1:9])
      mydata$avgScore <- rowSums(mydata[, 1:9])/9
  hist(mydata$avgScore)

# refined ---------------------------------------------------------------------
  model <- '
            tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
           '
  fit <- sem(model, data = mydata, meanstructure = TRUE,
             missing = "pairwise", estimator = "WLSMV")
  factorScore <- predict(fit)
  hist(factorScore[,1])

Ho rimosso "interventi" dal titolo per far sembrare la domanda più generale e perché gli interventi probabilmente non hanno un rapporto unico e specifico sulla distinzione tra i due tipi di calcolo dei costrutti. Ti preghiamo di ripristinare la mia modifica se non sei d'accordo.
ttnphns,

1
They are more exactQuesta enfasi aggiuntiva non dovrebbe distrarci dal fatto che anche i punteggi dei fattori sono inevitabilmente inesatti ("sottodeterminati").
ttnphns,

Vedi anche questa domanda simile: stats.stackexchange.com/q/31967/3277 .
ttnphns,

Penso che gli "interventi" siano rilevanti come casi d'uso speciali, ma non devono necessariamente essere presenti nel titolo. Ho evidenziato il problema chiave nella domanda. Per quanto riguarda l'enfasi sul "più esatto", ero curioso di avere pensieri su questo punto, dato che l'osservazione che fai riguardo ai punteggi dei fattori è indeterminata. Grazie per i collegamenti ad altre domande.
Eric Green,

"more exact". Tra i punteggi dei fattori calcolati linearmente il metodo di regressione è il più "esatto" nel senso "più correlato con i valori del fattore reale sconosciuti". Quindi sì, più esatto (nell'approccio algebrico lineare), ma non del tutto esatto.
ttnphns,

Risposte:


6

Ho lottato con questa idea me stesso in alcuni progetti attuali. Penso che devi chiederti cosa viene stimato qui. Se si adatta un modello a un fattore, i punteggi dei fattori stimano il fattore latente. La somma o media delle variabili manifest manifesta una stima di qualcos'altro, a meno che ogni osservazione non si carichi allo stesso modo sul fattore e anche le unicità siano le stesse. E quel qualcos'altro probabilmente non è una quantità di grande interesse teorico.

Quindi, se un modello a un fattore si adatta, probabilmente si consiglia di utilizzare i punteggi dei fattori. Prendo in considerazione la comparabilità tra gli studi, ma all'interno di uno studio particolare, penso che i punteggi dei fattori abbiano molto da fare.

Il punto in cui diventa interessante è quando un modello a un fattore non si adatta, sia perché si applica un modello a due fattori (o superiore), sia perché la struttura della covarianza è più complicata di quanto preveda un modello a fattore. Per me, quindi, la domanda è se il totale semplice delle variabili si riferisce a qualcosa di reale. Ciò è particolarmente vero se i dati hanno più di una dimensione. In pratica, ciò che accade spesso è che hai un sacco di variabili correlate (elementi in un sondaggio, forse), con uno o due di loro molto diversi dagli altri. Puoi dire "all'inferno con questo" e prendere la media di tutto, indipendentemente dal significato. Oppure puoi andare con i punteggi dei fattori. Se si adatta un modello a un fattore, ciò che accadrà in genere è che l'analisi del fattore ridimensionerà le variabili meno utili (o almeno, quelle che appartengono davvero al punteggio del secondo fattore). In effetti, li individua come appartenenti a una dimensione diversa e li ignora.

Quindi credo che il punteggio del fattore possa in qualche modo eliminare i dati per dare qualcosa di più unidimensionale di quello che hai iniziato. Ma non ho un riferimento per questo, e sto ancora cercando di capire nel mio lavoro se mi piace questo approccio. Per me, il grande pericolo è un eccesso di adattamento quando si inseriscono i punteggi in un altro modello con gli stessi dati. I punteggi sono già la risposta a una domanda di ottimizzazione, quindi da dove viene il resto dell'analisi? Odio pensare.

Ma alla fine, una somma o un totale di variabili ha davvero senso se qualcosa come un modello a un fattore non si applica?

Molte di queste domande non sorgerebbero se le persone progettassero scale migliori per cominciare.


Apprezzo i tuoi commenti, @Placidia. Tu porti un po 'di chiarezza mentre ci ricordi il pasticcio più grande! Penso che questo sia un punto interessante da considerare: "Se il modello fattoriale si adatta, allora i punteggi dei fattori stimano il fattore latente. La somma o media media delle variabili manifest stimano qualcos'altro, a meno che ogni osservazione non si carichi ugualmente sul fattore, e il le unicità sono uguali. E che qualcos'altro probabilmente non è una quantità di grande interesse teorico ".
Eric Green,

+1 per una risposta molto ponderata. Un paio di pensieri da aggiungere: 1) per quanto riguarda la comparabilità tra gli studi, è importante riconoscere che, diversamente dai caricamenti dei componenti - che possono cambiare un po 'in risposta alle variabili incluse / escluse dal modello - i caricamenti dei fattori comuni sono le stime dei parametri. Successivamente, dovrebbero replicarsi (all'interno dell'errore di campionamento) da uno studio all'altro, e quindi anche i punteggi dei fattori. 2) Se sei preoccupato per l'utilizzo dei punteggi dei fattori, potresti guardare gli indici di determinatezza e quanto bene le correlazioni del punteggio dei fattori rispecchiano le correlazioni latenti ...
jsakaluk,

1
... poiché penso che questa sia una strategia discussa in DiStefanno et. al. documento per valutare se i punteggi dei fattori possono essere "attendibili". E infine 3) se il tuo obiettivo, come descrive Placidia, è quello di analizzare qualcosa che è in gran parte unidimensionale, potresti considerare un approccio di analisi bifattore, che a quanto ho capito, estrae dapprima un fattore comune su cui si carica ogni variabile, quindi successiva ortogonale i fattori vengono estratti per sottoinsiemi di variabili, che apparentemente riflettono i più importanti fattori distinguibili, al di là della dimensione comune che unisce tutte le variabili.
jsakaluk,

Placidia, nell'ultima modifica della tua risposta, ti limiti ripetutamente dall'espressione one-factor model. Mi chiedo solo perché. Stai dicendo che in un modello a 2 fattori i punteggi dei fattori non lo fanno estimate the latent factorpiù? Perchè così? Inoltre, come si definisce il "modello a un fattore" nel contesto di un questionario in fase di sviluppo (il contesto probabile della Q): è che il questionario è a fattore singolo / scala o che ogni elemento incluso viene conteggiato appartenendo strettamente a un fattore /scala? Per favore, ti dispiacerà renderlo più chiaro?
ttnphns,

Volevo evitare potenziali incomprensioni. Se credi in un modello a due fattori, presumibilmente l'utilizzo dei totali di riepilogo sarebbe fuori dalla tabella. Sono necessari due riepiloghi per due dimensioni nei dati. Volevo chiarire che la mia risposta riguardava la scelta tra la statistica sommaria e il punteggio dei fattori del modello a un fattore. Sostengo che il punteggio a un fattore può essere utile anche se il modello è falso. Il suggerimento di @ jsakaluk di adattare un modello a più fattori e scegliere il primo fattore è anche possibile, e potrebbe essere migliore in alcuni casi.
Placidia,

4

La somma o la media degli elementi caricati dal fattore comune è un modo tradizionale per calcolare il punteggio della struttura (il costrutto che rappresenta il fattore). È una versione più semplice del "metodo approssimativo" dei punteggi dei fattori di calcolo ; il punto principale del metodo sta nell'utilizzare i caricamenti dei fattori come pesi del punteggio. Mentre metodi raffinati per calcolare i punteggi utilizzano coefficienti di punteggio appositamente stimati (calcolati dai caricamenti) come pesi.

Questa risposta non suggerisce universalmente "quando usare i punteggi dei fattori [raffinati] sulla semplice somma dei punteggi degli oggetti", che è un dominio vasto, ma si concentra sulla dimostrazione di alcune ovvie implicazioni concrete che vanno preferendo un modo di calcolare il costrutto rispetto all'altro modo.

Fb1b2F

s1=b1r11+b2r12

s2=b1r12+b2r22

s1s2r12bbb

rr11r22

b1=s2r12s1r1221

b2=s1r12s2r1221

b1b2=(r12+1)(s1s2)r1221.

bsr12b1b2

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine

s1s2=0bs1s2b1b2r12

b

s1=.70s2=.45.25

c. Se sono fortemente correlati, l'elemento caricato più debole è un duplicato junior dell'altro. Qual è la ragione per contare quell'indicatore / sintomo più debole in presenza del suo sostituto più forte? Nessun motivo. E i punteggi dei fattori si adattano per questo (mentre la semplice somma non lo fa). Si noti che in un questionario multifattoriale l '"elemento caricato più debole" è spesso un altro elemento, caricato più in alto; mentre nel presente fattore questo oggetto viene trattenuto, come vediamo ora, nel calcolo dei punteggi dei fattori, e questo serve bene.

b. Ma se gli articoli, sebbene caricati come prima in modo diseguale, non sono così fortemente correlati, allora sono diversi indicatori / sintomi per noi. E potrebbe essere contato "due volte", cioè appena sommato. In questo caso, i punteggi dei fattori cercano di rispettare l'elemento più debole nella misura in cui il suo caricamento lo consente ancora, poiché è una diversa forma di realizzazione del fattore.

un. Due elementi possono anche essere conteggiati due volte, cioè semplicemente sommati, ogni volta che hanno caricamenti simili, sufficientemente elevati per fattore, indipendentemente dalla correlazione tra questi elementi. (I punteggi dei fattori aggiungono più peso ad entrambi gli articoli quando sono correlati non troppo stretti, tuttavia i pesi sono uguali.) Non sembra irragionevole che di solito tolleriamo o ammettiamo articoli abbastanza duplicati se sono tutti fortemente caricati. Se non ti piace (a volte potresti volerlo) sei sempre libero di eliminare manualmente i duplicati dal fattore.

inserisci qui la descrizione dell'immagine

Quindi, nel calcolo dei punteggi dei fattori (perfezionati) (almeno con il metodo di regressione), ci sono evidenti intrighi "andare d'accordo / spingere" tra le variabili che costituiscono il costrutto, nella loro influenza sui punteggi . Indicatori altrettanto forti si tollerano a vicenda, così come lo sono anche quelli non equamente forti e fortemente correlati. "Chiusura" si verifica di un indicatore più debole fortemente correlato con indicatori più forti. La semplice aggiunta / media non ha quell'intrigo "espellere un duplicato debole".

Si prega di vedere anche questa risposta che avverte che teoricamente il fattore è piuttosto un '"essenza dentro" piuttosto che una raccolta grossolana o un mucchio di "suoi" fenomeni indicativi. Pertanto, riassumere ciecamente gli elementi, tenendo conto dei loro carichi e delle loro correlazioni, è potenzialmente problematico. D'altra parte, il fattore, come segnato, può essere solo una sorta di somma dei suoi oggetti, e quindi tutto riguarda una migliore concezione dei pesi nella somma.


Diamo anche uno sguardo alla carenza del metodo grossolano o sommatorio in modo più generale e astratto .

ba

F^iiFiX1X2a1a2FUb

F^i=b1X1i+b2X2i=b1(Fi+U1i)+b2(Fi+U2i)=(b1+b2)Fi+b1U1i+b2U2i

b1U1i+b2U2iF^iFiUF^Fbvar[b1U1i+b2U2i]F^FbaXF^F

abFF^

F^i=a1X1i+a2X2i= ... =(a1+a2)Fi+a1U1i+a2U2i

baaa


Grazie, @ttnphns, per la risposta utile. Per me ha senso che gli articoli con carichi approssimativamente uguali possano essere semplicemente sommati (a). Sfortunatamente, non credo di aver mai incontrato una situazione nel mio lavoro in cui, quando si utilizza una scala esistente apparentemente unidimensionale, trovo che gli articoli abbiano carichi uguali.
Eric Green,

Quindi ero particolarmente interessato alla tua spiegazione di una situazione in cui i carichi differiscono e al suggerimento di esaminare le correlazioni tra gli articoli. Sono interessato a sapere se hai delle regole empiriche per correlazioni "forti" (c) / "non forti" (b) o caricamenti "sufficientemente alti" in (a).
Eric Green,

1
Infine, noterò che lo sfondo di questa domanda è una schiacciante norma disciplinare (almeno in psicologia) per usare scale "convalidate" che richiedono somme semplici (medie) anche quando si somministra la scala a una nuova popolazione non normata. Spesso l'obiettivo sono confronti tra campioni (anche se ingiustificati), il che rende le somme semplici un approccio comune.
Eric Green,

Gli studi di intervento sono un caso d'uso interessante nella mia mente perché il confronto degli interessi è nel campione. Mi sembra che ci preoccupiamo di più della dimensione dell'effetto del trattamento rispetto ai punteggi "grezzi" di entrambi i gruppi sulla misura, specialmente quando si utilizza la scala esterna alla popolazione utilizzata per sviluppare / normare la scala. Se i punteggi dei fattori sono "migliori" in alcune situazioni, allora vale la pena lanciare il semplice approccio a favore di uno che ha più senso concettuale sapendo che alla fine vogliamo solo esaminare le dimensioni degli effetti del trattamento.
Eric Green,

1
(cont.) Use "validated" scalesnon richiede di per sé somme necessariamente semplici: se la validazione era buona (campione ampio rappresentativo, buone correlazioni, numero corretto di fattori, adattamento corretto, ecc.) i punteggi dei fattori calcolati (i loro coefficienti) possono essere presi come norma pesi da utilizzare in nuove popolazioni. A questo proposito, non vedo alcun vantaggio nella somma semplice.
ttnphns,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.