Quali sono le buone statistiche di base da usare per i dati ordinali?


67

Ho ottenuto alcuni dati ordinali dalle domande del sondaggio. Nel mio caso sono risposte in stile Likert (Fortemente in disaccordo, in disaccordo, neutrale, d'accordo, fortemente d'accordo). Nei miei dati sono codificati come 1-5.

Non credo che significherebbe molto qui, quindi quali statistiche di riepilogo di base sono considerate utili?


2
Le scelte comuni includono - mediane, modalità, proporzioni o proporzioni cumulative in ciascun gruppo
Glen_b

Risposte:


29

Una tabella delle frequenze è un buon punto di partenza. Puoi fare il conteggio e la frequenza relativa per ogni livello. Inoltre, possono essere utili il conteggio totale e il numero di valori mancanti.

È inoltre possibile utilizzare una tabella di contingenza per confrontare due variabili contemporaneamente. Può essere visualizzato anche utilizzando una trama mosaico.


32

Sosterrò da una prospettiva applicata che la media è spesso la scelta migliore per riassumere la tendenza centrale di un oggetto Likert. In particolare, sto pensando a contesti come sondaggi sulla soddisfazione degli studenti, scale di ricerche di mercato, sondaggi di opinione dei dipendenti, articoli di test di personalità e molti articoli di sondaggi di scienze sociali.

In tali contesti, i consumatori della ricerca spesso vogliono risposte a domande come:

  • Quali dichiarazioni hanno un accordo più o meno relativo ad altre?
  • Quali gruppi concordano più o meno con una determinata dichiarazione?
  • Nel tempo, l'accordo è aumentato o diminuito?

Per questi scopi, la media ha diversi vantaggi:

1. La media è facile da calcolare:

  • È facile vedere la relazione tra i dati grezzi e la media.
  • È pragmaticamente facile da calcolare. Pertanto, la media può essere facilmente incorporata nei sistemi di reporting.
  • Facilita anche la comparabilità tra contesti e impostazioni.

2. La media è relativamente ben compresa e intuitiva:

  • La media viene spesso utilizzata per segnalare la tendenza centrale degli articoli Likert. Pertanto, i consumatori della ricerca hanno maggiori probabilità di comprendere il mezzo (e quindi fidarsi di esso, e agire di conseguenza).
  • Alcuni ricercatori preferiscono l'opzione, probabilmente, ancora più intuitiva di riportare la percentuale del campione che risponde a 4 o 5. Vale a dire, ha l'interpretazione relativamente intuitiva di "accordo percentuale". In sostanza, questa è solo una forma alternativa del mezzo, con la 0, 0, 0, 1, 1codifica.
  • Inoltre, nel tempo, i consumatori della ricerca costruiscono strutture di riferimento. Ad esempio, quando si confronta il rendimento dell'insegnamento di anno in anno o tra le varie materie, si crea un senso sfumato di ciò che indica una media di 3,7, 3,9 o 4,1.

3. La media è un singolo numero:

  • Un singolo numero è particolarmente prezioso, quando si desidera fare affermazioni come "gli studenti erano più soddisfatti del Soggetto X rispetto al Soggetto Y."
  • Trovo anche empiricamente che un singolo numero è in realtà la principale informazione di interesse in un oggetto Likert. La deviazione standard tende a essere correlata alla misura in cui la media è vicina al punteggio centrale (ad es. 3.0). Naturalmente, empiricamente, questo potrebbe non essere applicabile nel tuo contesto. Ad esempio, ho letto da qualche parte che quando le classificazioni di You Tube avevano il sistema stellare, c'era un gran numero di quelle più basse o più alte. Per questo motivo, è importante ispezionare le frequenze delle categorie.

4. Non fa molta differenza

  • Anche se non l'ho testato formalmente, ipotizzerei che, allo scopo di confrontare i rating delle tendenze centrali tra gli elementi, o gruppi di partecipanti, o nel tempo, qualsiasi scelta ragionevole di ridimensionamento per generare la media darebbe conclusioni simili.

4
Bel post! Hai qualche idea su come diverse culture / paesi potrebbero usare scale di likert che avrebbero un impatto drastico su questo tipo di risultati?
Insegui il

@chase Ci sono ricerche su questo, ma è da un po 'che non lo guardo. Ecco un esempio di ricerca su Google scholar.google.com.au/…
Jeromy Anglim

Concordo con la giustificazione del sig. Jeromy Anglim sull'uso della media (ovvero, la media ponderata deve essere esatta) come l' interpretazione imparziale più descrittiva più affidabile delle variabili categoriali ordinate come l'uso della scala di Likert in cui ciascuno dei punti di dati contribuisce al media finale.


28

Per i riassunti di base, concordo sul fatto che le tabelle delle frequenze di segnalazione e alcune indicazioni sulla tendenza centrale vadano bene. Per concludere, un recente articolo pubblicato su PARE ha discusso del test t- vs. MWW, Five-Point Likert Items: test t contro Mann-Whitney-Wilcoxon .

Per un trattamento più elaborato, consiglierei di leggere la recensione di Agresti sulle variabili categoriche ordinate:

Liu, Y e Agresti, A (2005). L'analisi dei dati categorici ordinati: una panoramica e un'indagine sugli sviluppi recenti . Sociedad de Estadística e Investigación Operativa Test , 14 (1), 1-73.

Si estende in gran parte oltre le normali statistiche, come il modello basato sulla soglia (ad es. Rapporto di probabilità proporzionale), e vale la pena leggere al posto del libro CDA di Agresti .

Di seguito mostro un'immagine di tre diversi modi di trattare un oggetto Likert; dall'alto verso il basso, la vista "frequenza" (nominale), la vista "numerica" ​​e la vista "probabilistica" (un modello di credito parziale ):

testo alternativo

I dati provengono dai Sciencedati nel ltmpacchetto, in cui la voce riguardava la tecnologia ("La nuova tecnologia non dipende dalla ricerca scientifica di base", con la risposta "fortemente in disaccordo" per "essere fortemente d'accordo", su una scala di quattro punti)


14

La pratica convenzionale consiste nell'utilizzare la somma dei ranghi delle statistiche non parametriche e il rango medio per descrivere i dati ordinali.

Ecco come funzionano:

Somma di rango

  • assegnare un grado a ciascun membro in ciascun gruppo;

  • ad esempio, supponiamo che tu stia guardando gli obiettivi per ciascun giocatore in due squadre di calcio avversarie, quindi classifica ogni membro in entrambe le squadre dalla prima all'ultima;

  • calcolare la somma dei ranghi aggiungendo i ranghi per gruppo ;

  • l'entità della somma dei ranghi indica quanto vicini sono i ranghi per ciascun gruppo

Rango medio

M / R è una statistica più sofisticata di R / S perché compensa le dimensioni disuguali nei gruppi che si stanno confrontando. Quindi, oltre ai passaggi precedenti, dividi ogni somma per il numero di membri nel gruppo.

Una volta che hai queste due statistiche, puoi, per esempio, z-test della somma dei ranghi per vedere se la differenza tra i due gruppi è statisticamente significativa (credo che sia noto come il test di somma dei ranghi di Wilcoxon , che è intercambiabile, cioè funzionalmente equivalente al test U di Mann-Whitney).

Funzioni R per queste statistiche (comunque quelle che conosco):

wilcox.test nell'installazione R standard

meandanks nel pacchetto manovelle


3

Basato sull'estratto Questo articolo può essere utile per confrontare diverse variabili con scala di Likert. Confronta due tipi di test di confronto multiplo non parametrici: uno basato sui ranghi e uno basato su un test di Chacko. Include simulazioni.


Al momento, sembra quasi un commento, @PeterFlom. Sebbene la biblioteca digitale ACM sia probabilmente meno suscettibile al marciume dei link, ti ​​dispiacerebbe dire qualcosa sull'articolo, forse una precisazione delle informazioni utili che fornisce?
gung - Ripristina Monica

2
Ciao @gung, non ero sicuro di dove inserire il commento in questo lungo thread. Ho aggiunto la citazione qui poiché la domanda pubblicata oggi è stata chiusa e questo articolo sembra utile (e tratta problemi che non ho visto altrove)
Peter Flom - Reinstate Monica

2

Di solito mi piace usare la trama a mosaico. Puoi crearli incorporando altre covariate di interesse (come: sesso, fattori stratificati ecc.)


2

Sono d'accordo con la valutazione di Jeromy Anglim. Ricorda che le risposte di Likert sono stime: non stai utilizzando un righello perfettamente affidabile per misurare un oggetto fisico con dimensioni stabili. La media è una misura potente quando si usano campioni di dimensioni ragionevoli.

Nelle attività di ricerca e sviluppo di prodotti e prodotti, la media è di gran lunga la statistica più comune utilizzata con le scale Likert. Quando utilizzo le bilance Likert di solito ho scelto una misura che si adatta idealmente alla domanda di ricerca. Ad esempio, se stai parlando di "preferenze" o "atteggiamenti" puoi utilizzare più indicatori basati su Likert, con ciascun indicatore che fornisce una visione leggermente diversa.

iX


1

I "punteggi delle caselle" sono spesso usati per riassumere i dati ordinali, in particolare quando si tratta di ancore verbali significative. In altre parole, potresti segnalare "top 2 box", la percentuale che ha scelto "d'accordo" o "fortemente d'accordo".

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.