È appropriato trattare i dati della scala di Likert n-point come n prove da un processo binomiale?


11

Non mi è mai piaciuto il modo in cui le persone analizzano normalmente i dati dalle scale di Likert come se l'errore fosse continuo e gaussiano quando ci sono ragionevoli aspettative che queste ipotesi vengano violate almeno agli estremi delle scale. Cosa ne pensi della seguente alternativa:

Se la risposta assume il valore su una scala point, espandi quei dati a prove, di cui hanno il valore 1 e di cui hanno il valore 0. Pertanto, stiamo trattando la risposta su una scala Likert come se è l'aggregato manifesto di una serie nascosta di prove binomiali (in effetti, dal punto di vista della scienza cognitiva, questo è in realtà un modello accattivante per i meccanismi coinvolti in tali scenari decisionali). Con i dati espansi, è ora possibile utilizzare un modello di effetti misti che specifica il rispondente come effetto casuale (anche domanda come effetto casuale se si hanno più domande) e utilizzando la funzione di collegamento binomiale per specificare la distribuzione dell'errore.n n k n - kknnknk

Qualcuno può vedere qualche violazione dell'assunzione o altri aspetti dannosi di questo approccio?


2
Conoscete qualche ricerca pubblicata che consideri i vantaggi relativi dell'uso delle scale likert come intervalli rispetto ai dati ordinali? Forse, i difetti nel trattarli come scale a livello di intervallo non sono abbastanza gravi da giustificare un approccio complesso. In tal caso, il tuo approccio potrebbe essere semplicemente una caccia all'oca selvatica.

Risposte:


16

Non conosco alcun articolo relativo alla tua domanda nella letteratura psicometrica. Mi sembra che i modelli logistici ordinati che consentono componenti di effetti casuali possano gestire abbastanza bene questa situazione.

Sono d'accordo con @Srikant e penso che un modello di probabilità proporzionale o un modello probit ordinato (a seconda della funzione di collegamento scelta) potrebbe riflettere meglio la codifica intrinseca degli articoli Likert e il loro uso tipico come scale di valutazione in sondaggi di opinione / atteggiamento o questionari .

Altre alternative sono: (1) uso di categorie adiacenti anziché proporzionali o cumulative (dove esiste una connessione con modelli log-lineari); (2) uso di modelli di risposta agli articoli come il modello di credito parziale o il modello della scala di rating (come menzionato nella mia risposta sull'analisi delle scale di Likert ). Quest'ultimo caso è paragonabile a un approccio a effetti misti, con soggetti trattati come effetti casuali, ed è prontamente disponibile nel sistema SAS (ad esempio, adattamento di modelli a effetti misti per risultati ordinali ripetuti con la procedura NLMIXED ) o R (vedi vol. 20 del Journal of Statistical Software ). Potresti anche essere interessato alla discussione fornita da John Linacre sull'ottimizzazione dell'efficacia della categoria della scala di valutazione .

Possono essere utili anche i seguenti documenti:

  1. Wu, CH (2007). Uno studio empirico sulla trasformazione dei dati su scala Likert in punteggi numerici . Applied Mathematical Sciences , 1 (58) : 2851-2862.
  2. Rost, J and and Luo, G (1997). Un'applicazione di un modello di spiegamento basato su Rasch a un questionario sul centrismo adolescenziale . In Rost, J e Langeheine, R (Eds.), Applicazioni di tratti latenti e modelli di classe latente nelle scienze sociali , New York: Waxmann.
  3. Lubke, G e Muthen, B (2004). L'analisi fattoriale dei dati su scala di Likert secondo il presupposto della normalità multivariata complica un confronto significativo tra gruppi osservati o classi latenti . Modellazione di equazioni strutturali , 11 : 514-534.
  4. Nering, ML e Ostini, R (2010). Manuale dei modelli di teoria degli oggetti polittici . Routledge Academic
  5. Bender R e Grouven U (1998). Utilizzo di modelli di regressione logistica binaria per dati ordinali con probabilità non proporzionali. Journal of Clinical Epidemiology , 51 (10) : 809-816. (Impossibile trovare il pdf ma questo è disponibile, regressione logistica ordinale nella ricerca medica )

1
La regressione logistica ordinale a effetti misti è disponibile anche in R con il pacchetto ordinale e clmm ().
Giovanni

9

Se desideri davvero abbandonare l'assunzione di dati a livello di intervallo per le scale likert, suggerirei invece di assumere i dati come logit o probit ordinati. Le scale Likert di solito misurano la forza della risposta e quindi valori più alti dovrebbero indicare una risposta più forte sull'elemento di interesse sottostante.

Supponiamo di avere una scala oggetto e che rappresenti la forza inosservata della risposta sull'oggetto di interesse. Quindi puoi assumere il seguente modello di risposta:SHS

S α 1y=1 seSα1

α h - 1 < S α h h = 2 , 3 , . . H - 1y=h  if perαh1<S αhh=2,3,..H1

α H - 1 < S < y=H  ifαH1<S< 

Supponendo che segua una distribuzione normale con una media sconosciuta e la varianza darebbe un modello probit ordinato.S


2

Una preoccupazione sarebbe che usando questo approccio si imponga una relazione specifica tra la media e la varianza della risposta. Per il tipo di sondaggi in cui vengono spesso utilizzate le scale di Likert, ad esempio si sceglie una delle cinque categorie tra "Fortemente d'accordo" e "Fortemente in disaccordo" rispetto a una frase o ad un'altra - mi sembra sbagliato. Ad esempio, mi aspetto che una scala di dieci punti fornisca all'incirca la stessa distribuzione di risposte di una scala di cinque punti se si comprimono coppie adiacenti di categorie: per una risposta & comunenpnp(1p)yp

Prn=4(Y=y)Prn=9(Y=2y)+Prn=9(Y=2y+1)
Ricordo alcune ricerche che sembrano confermarlo: Coelho & Esteves (2006), "La scelta tra una scala da cinque a dieci punti nel quadro della misurazione della soddisfazione del cliente".

1

È possibile utilizzare l'approssimazione binomiale in una scala di Likert a 5 punti se si combina l'accordo e si è fortemente d'accordo in un gruppo e in disaccordo e in forte disaccordo in un altro. Ovviamente, devi ancora decidere dove vanno i neutri. Metterei i neutri in ogni gruppo, userei la normale approssimazione al binomio (purché tu abbia più di 40 risposte) e svilupperei intervalli di confidenza sulle proporzioni di ciascun gruppo (vedi qualsiasi testo stat standard su come ottenere conf. intervalli su proporzioni provenienti da una distribuzione binomiale con l'approssimazione normale). Quindi, inserivo i neutri nell'altro gruppo e ripetevo gli intervalli di confidenza. Se ottengo la stessa conclusione da entrambi, allora c'è una potenziale conclusione. Altrimenti, non vedo come il binomio possa essere usato con i dati Likert.


0

Se ho capito bene, questo articolo suggerisce un approccio molto simile a quello che hai descritto, suggerendo che sì, in effetti, i dati simili a Likert possono derivare da un processo binomiale.

Rif. Completo: Allik, J. (2014). Un modello binomiale misto per misure di personalità di tipo Likert. Frontiers in Psychology , (5) 371


Benvenuti nel sito! Potresti aggiungere un riferimento completo per quel documento? È una pratica standard qui perché i collegamenti tendono a scomparire.
mkt - Ripristina Monica l'

-1

In realtà sto preparando un documento in cui sto usando il tuo approccio nel trattare una risposta su un oggetto simile come se fosse l'aggregato manifesto di una serie nascosta di prove binomiali.

Nel mio articolo la distribuzione binomiale viene utilizzata per spiegare la forma delle distribuzioni di frequenza osservate. La logica alla base di questo approccio è data da due ipotesi. In molte applet, mostrando come nasce la distribuzione binomiale, uno ha ripetuto prove indipendenti di Bernoulli con una sola palla che cade attraverso una serie di pin. Ogni volta che una palla cade su un perno, rimbalzerà a destra (cioè un successo) con probabilità p oppure a sinistra (cioè un fallimento) con probabilità 1-p. Dopo che la pallina cade attraverso l'array, atterra in un cestino contrassegnato dal numero corrispondente di successi. Nel mio articolo il processo decisionale è anche visto come una serie di ripetuti processi indipendenti di Bernoulli in cui, ad ogni processo, il soggetto decide di accettare o meno l'accordo in questione.

(i) Ad ogni processo indipendente di Bernoulli il soggetto decide di concordare con probabilità p o di non essere d'accordo (in disaccordo) con probabilità 1-p.

(ii) Se per la dichiarazione sono disponibili cinque categorie di risposta, il numero di volte in cui viene presa una decisione di Bernoulli in merito alla decisione di concordare o non concordare (in disaccordo) è pari a 4 (5-1).

La scelta finale per una specifica categoria di risposta è data dalle seguenti regole.

  • Se in tutti (quattro) casi viene presa una decisione di accordo di Bernoulli, verrà data la risposta "fortemente d'accordo".

  • Se in tre casi viene presa una decisione di accordo di Bernoulli, verrà data la risposta "d'accordo".

  • Se in due casi viene presa una decisione di accordo di Bernoulli, verrà data la risposta "indecisa".

  • Se in un solo caso viene presa una decisione di accordo di Bernoulli, verrà data la risposta "in disaccordo".

  • Se in nessun caso viene presa una decisione di accordo di Bernoulli, verrà data la risposta "in forte disaccordo".

Un ragionamento simile può essere fornito usando decisioni di "disaccordo". Al fine di ottenere una distribuzione binomiale, il punteggio delle categorie di risposta è il seguente.

fortemente in disaccordo = 0, in disaccordo = 1, neutro = 2, d'accordo = 3, fortemente d'accordo = 4

Queste due ipotesi portano a una distribuzione binomiale per le frequenze di risposta a condizione che non vi siano differenze sistematiche tra gli intervistati.

Spero tu possa essere d'accordo. Gradirei molto se potessi migliorare il mio inglese nel testo sopra.


Ho rimosso la tua risposta precedente. Si noti che il mio commento non è stato inteso come un'osservazione negativa; le risposte di una riga non sono generalmente molto istruttive e si preferiscono risposte discutibili (ma consultare le nostre FAQ ).
chl

1
Questa è una proposta interessante e creativa, ma ne sono scettica. Sia nella tua versione che nella regressione logistica ordinale, come suggerito, ad esempio, da altri su questo thread, sarà richiesto il presupposto delle probabilità proporzionali. Tuttavia, l'OLR consentirà alle soglie / ai punti di interruzione delle categorie di variare in modo più flessibile, credo, mentre saranno determinati dai parametri binomiali & nel tuo schema. Questa ipotesi dovrebbe essere verificata rispetto ai dati, e sospetto, porterebbe a problemi. (A proposito, il -1 non è venuto da me.)pn
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.