Molti studi nelle scienze sociali usano le scale di Likert. Quando è appropriato usare i dati di Likert come ordinali e quando è appropriato usarli come dati di intervallo?
Molti studi nelle scienze sociali usano le scale di Likert. Quando è appropriato usare i dati di Likert come ordinali e quando è appropriato usarli come dati di intervallo?
Risposte:
Forse troppo tardi ma aggiungo comunque la mia risposta ...
Dipende da cosa intendi fare con i tuoi dati: se sei interessato a mostrare che i punteggi differiscono quando consideri un diverso gruppo di partecipanti (genere, paese, ecc.), Puoi trattare i tuoi punteggi come valori numerici, a condizione che soddisfino le solite ipotesi sulla varianza (o sulla forma) e sulla dimensione del campione. Se sei piuttosto interessato a evidenziare come i modelli di risposta variano tra i sottogruppi, allora dovresti considerare i punteggi degli articoli come una scelta discreta tra una serie di opzioni di risposta e cercare la modellazione log-lineare, la regressione logistica ordinale, i modelli di risposta degli articoli o qualsiasi altro modello statistico che consente di far fronte a oggetti politomici.
Come regola generale, si considera generalmente che avere 11 punti distinti su una scala sia sufficiente per approssimare una scala di intervallo (per scopi di interpretazione, vedere il commento di @ xmjx)). Gli oggetti di Likert possono essere considerati come una vera scala ordinale, ma sono spesso usati come valori numerici e possiamo calcolare la loro media o SD. Questo viene spesso fatto nelle indagini sull'atteggiamento, sebbene sia saggio riportare sia la media / DS che la percentuale di risposta, ad esempio nelle due categorie più alte.
Quando si utilizzano i punteggi di scala sommati (ad esempio, sommiamo il punteggio su ciascun elemento per calcolare un "punteggio totale"), è possibile applicare le normali statistiche, ma è necessario tenere presente che si sta lavorando con una variabile latente, quindi il costrutto sottostante dovrebbe avere senso! In psicometria, generalmente controlliamo che (1) l'unidimensionalità della scala sia, (2) l'affidabilità della scala è sufficiente. Quando si confrontano due punteggi di scala di questo tipo (per due strumenti diversi), si potrebbe anche considerare l'uso di misure di correlazione attenuate invece del classico coefficiente di correlazione di Pearson.
I libri di testo classici includono:
1. Nunnally, JC e Bernstein, IH (1994). Teoria psicometrica (3a ed.). Serie di McGraw-Hill in psicologia.
2. Streiner, DL e Norman, GR (2008). Bilance per la misurazione della salute. Una guida pratica per il loro sviluppo e utilizzo (4a ed.). Oxford.
3. Rao, CR e Sinharay, S., Eds. (2007). Manuale di statistica, vol. 26: Psicometria . Elsevier Science BV
4. Dunn, G. (2000). Statistica in psichiatria . Hodder Arnold.
Puoi anche dare un'occhiata alle Applicazioni del tratto latente e ai modelli di classe latente nelle scienze sociali , da Rost & Langeheine, e dal sito Web di W. Revelle sulla ricerca della personalità .
Quando si convalida una scala psicometrica, è importante considerare i cosiddetti effetti soffitto / pavimento (grande asimmetria derivante dal punteggio dei partecipanti alla categoria di risposta più bassa / più alta), che possono avere un impatto serio su qualsiasi statistica calcolata trattandoli come variabili numeriche ( ad es. aggregazione per paese, test t). Ciò solleva questioni specifiche negli studi interculturali poiché è noto che la distribuzione della risposta globale nell'attitudine o nei sondaggi sanitari differisce da un paese all'altro (ad esempio, i cinesi rispetto a quelli provenienti dai paesi occidentali tendono ad evidenziare un modello di risposta specifico, il primo con punteggi generalmente più estremi a livello di elemento, vedere ad esempio Song, X.-Y. (2007) Analisi di modelli di equazioni strutturali multisample con applicazioni ai dati sulla qualità della vita, inManuale di variabili latenti e modelli correlati , Lee, S.-Y. (Ed.), Pagg. 279-302, Olanda settentrionale).
Più in generale, dovresti guardare la letteratura psicometrica che fa ampio uso degli articoli Likert se sei interessato al problema della misurazione. Sono stati sviluppati vari modelli statistici e sono attualmente guidati nell'ambito della teoria della risposta agli oggetti.
La semplice risposta è che le scale di Likert sono sempre ordinali. Gli intervalli tra le posizioni sulla scala sono monotonici ma mai così ben definiti da essere incrementi numericamente uniformi.
Detto questo, la distinzione tra ordinale e intervallo si basa sulle esigenze specifiche dell'analisi in corso. In circostanze speciali, potresti essere in grado di trattare le risposte come se cadessero su una scala di intervallo. Per fare ciò, in genere gli intervistati devono essere in stretto accordo sul significato delle risposte in scala e l'analisi (o le decisioni prese sulla base dell'analisi) dovrebbe essere relativamente insensibile ai problemi che possono sorgere.
Oltre a quanto già detto sopra sulle scale sommate, vorrei anche menzionare che il problema può cambiare quando si analizzano i dati a livello di gruppo. Ad esempio, se stavi esaminando
In tutti questi casi ogni misura aggregata (forse la media) si basa su molte risposte individuali (ad es. N = 50, 100, 1000, ecc.). In questi casi l'elemento Likert originale inizia ad assumere proprietà che assomigliano a una scala di intervallo a livello aggregato.
scala di somiglianza sempre in forma ordinale: un metodo per attribuire il valore quantitativo ai dati qualitativi, per renderlo suscettibile all'analisi statistica. Un valore numerico viene assegnato a ciascuna scelta potenziale e una cifra media per tutte le risposte viene calcolata al termine della valutazione o del sondaggio.