In quali condizioni le bilance Likert devono essere utilizzate come dati ordinali o di intervallo?

52

Molti studi nelle scienze sociali usano le scale di Likert. Quando è appropriato usare i dati di Likert come ordinali e quando è appropriato usarli come dati di intervallo?

— Un leone
fonte

6

Tecnicamente le scale di Likert sono la somma di elementi di tipo Likert e come tali finiscono per essere una ragionevole approssimazione (almeno secondo molti psicometrici in Psicologia) di un punto di dati di intervallo.

— Russellpierce,

2

@drknexus - Quindi, più elementi servono come triangolazione di misurazione per scale di costruzione? In caso affermativo, quali sono i criteri per determinare che un ricercatore ha abbastanza punti dati rilevanti (cioè elementi) per usare la scala come misura di intervallo?

— Un leone,

2

Non ne sono sicuro; questa potrebbe essere una domanda degna per la comunità in generale. Immagino che probabilmente sia in parte un giudizio di valore da parte del ricercatore e dell'area. Alcune aree sono completamente disposte a trattare un singolo oggetto Likert come intervallo anche se chiaramente è ordinale. Una risposta ragionevole potrebbe essere quella di utilizzare un diverso metodo di analisi, ad esempio un test di permutazione o bootstrap. Un'altra risposta potrebbe essere quella di condurre un semplice test di normalità, purché l'aggregato non si discosti significativamente dalla normalità, probabilmente stai bene.

— Russellpierce,

1

... ma in generale sembra che si possa evocare il teorema del limite centrale e suggerire che da 20 a 30 articoli dovrebbero essere sufficienti per usare la bilancia come misura di intervallo.

— Russellpierce,

41

Forse troppo tardi ma aggiungo comunque la mia risposta ...

Dipende da cosa intendi fare con i tuoi dati: se sei interessato a mostrare che i punteggi differiscono quando consideri un diverso gruppo di partecipanti (genere, paese, ecc.), Puoi trattare i tuoi punteggi come valori numerici, a condizione che soddisfino le solite ipotesi sulla varianza (o sulla forma) e sulla dimensione del campione. Se sei piuttosto interessato a evidenziare come i modelli di risposta variano tra i sottogruppi, allora dovresti considerare i punteggi degli articoli come una scelta discreta tra una serie di opzioni di risposta e cercare la modellazione log-lineare, la regressione logistica ordinale, i modelli di risposta degli articoli o qualsiasi altro modello statistico che consente di far fronte a oggetti politomici.

Come regola generale, si considera generalmente che avere 11 punti distinti su una scala sia sufficiente per approssimare una scala di intervallo (per scopi di interpretazione, vedere il commento di @ xmjx)). Gli oggetti di Likert possono essere considerati come una vera scala ordinale, ma sono spesso usati come valori numerici e possiamo calcolare la loro media o SD. Questo viene spesso fatto nelle indagini sull'atteggiamento, sebbene sia saggio riportare sia la media / DS che la percentuale di risposta, ad esempio nelle due categorie più alte.

Quando si utilizzano i punteggi di scala sommati (ad esempio, sommiamo il punteggio su ciascun elemento per calcolare un "punteggio totale"), è possibile applicare le normali statistiche, ma è necessario tenere presente che si sta lavorando con una variabile latente, quindi il costrutto sottostante dovrebbe avere senso! In psicometria, generalmente controlliamo che (1) l'unidimensionalità della scala sia, (2) l'affidabilità della scala è sufficiente. Quando si confrontano due punteggi di scala di questo tipo (per due strumenti diversi), si potrebbe anche considerare l'uso di misure di correlazione attenuate invece del classico coefficiente di correlazione di Pearson.

I libri di testo classici includono:
1. Nunnally, JC e Bernstein, IH (1994). Teoria psicometrica (3a ed.). Serie di McGraw-Hill in psicologia.
2. Streiner, DL e Norman, GR (2008). Bilance per la misurazione della salute. Una guida pratica per il loro sviluppo e utilizzo (4a ed.). Oxford.
3. Rao, CR e Sinharay, S., Eds. (2007). Manuale di statistica, vol. 26: Psicometria . Elsevier Science BV
4. Dunn, G. (2000). Statistica in psichiatria . Hodder Arnold.

Puoi anche dare un'occhiata alle Applicazioni del tratto latente e ai modelli di classe latente nelle scienze sociali , da Rost & Langeheine, e dal sito Web di W. Revelle sulla ricerca della personalità .

Quando si convalida una scala psicometrica, è importante considerare i cosiddetti effetti soffitto / pavimento (grande asimmetria derivante dal punteggio dei partecipanti alla categoria di risposta più bassa / più alta), che possono avere un impatto serio su qualsiasi statistica calcolata trattandoli come variabili numeriche ( ad es. aggregazione per paese, test t). Ciò solleva questioni specifiche negli studi interculturali poiché è noto che la distribuzione della risposta globale nell'attitudine o nei sondaggi sanitari differisce da un paese all'altro (ad esempio, i cinesi rispetto a quelli provenienti dai paesi occidentali tendono ad evidenziare un modello di risposta specifico, il primo con punteggi generalmente più estremi a livello di elemento, vedere ad esempio Song, X.-Y. (2007) Analisi di modelli di equazioni strutturali multisample con applicazioni ai dati sulla qualità della vita, inManuale di variabili latenti e modelli correlati , Lee, S.-Y. (Ed.), Pagg. 279-302, Olanda settentrionale).

Più in generale, dovresti guardare la letteratura psicometrica che fa ampio uso degli articoli Likert se sei interessato al problema della misurazione. Sono stati sviluppati vari modelli statistici e sono attualmente guidati nell'ambito della teoria della risposta agli oggetti.

— CHL
fonte

2

Solo per chiarimenti: Nunnally / Bernstein suggeriscono di considerare una variabile come continua se ha almeno 11 valori distinti (p. 115). Da dove viene quella regola empirica "12 punti implicano la scala degli intervalli"?

— xmjx,

12

La semplice risposta è che le scale di Likert sono sempre ordinali. Gli intervalli tra le posizioni sulla scala sono monotonici ma mai così ben definiti da essere incrementi numericamente uniformi.

Detto questo, la distinzione tra ordinale e intervallo si basa sulle esigenze specifiche dell'analisi in corso. In circostanze speciali, potresti essere in grado di trattare le risposte come se cadessero su una scala di intervallo. Per fare ciò, in genere gli intervistati devono essere in stretto accordo sul significato delle risposte in scala e l'analisi (o le decisioni prese sulla base dell'analisi) dovrebbe essere relativamente insensibile ai problemi che possono sorgere.

— Tom
fonte

8

John Tukey scrisse altrimenti (nel 1960) in una monografia "Analisi dei dati e scienza comportamentale" (pubblicata su Collected Works v. III). Un risultato che ha ottenuto è che se stai migliorando circa il 10% di accordo test-retest, la tua scala non è abbastanza stretta!

— whuber

Questa risposta sembra confondere le scale Likert con gli elementi di valutazione originali. Vedi il commento di @ russellpierce.

— rolando2,

9

Oltre a quanto già detto sopra sulle scale sommate, vorrei anche menzionare che il problema può cambiare quando si analizzano i dati a livello di gruppo. Ad esempio, se stavi esaminando

soddisfazione di vita di stati o paesi,
soddisfazione professionale di organizzazioni o dipartimenti,
soddisfazione degli studenti nelle materie.

In tutti questi casi ogni misura aggregata (forse la media) si basa su molte risposte individuali (ad es. N = 50, 100, 1000, ecc.). In questi casi l'elemento Likert originale inizia ad assumere proprietà che assomigliano a una scala di intervallo a livello aggregato.

— Jeromy Anglim
fonte

-2

scala di somiglianza sempre in forma ordinale: un metodo per attribuire il valore quantitativo ai dati qualitativi, per renderlo suscettibile all'analisi statistica. Un valore numerico viene assegnato a ciascuna scelta potenziale e una cifra media per tutte le risposte viene calcolata al termine della valutazione o del sondaggio.

— Mubashara Hussain
fonte

5

Benvenuti nel nostro sito! Si prega di attribuire la tua quotazione o, in generale, qualsiasi parola che stai prendendo in prestito da qualcun altro.

— whuber