Calcola la media della variabile ordinale


20

Ho letto in diversi punti che il calcolo della media di una variabile ordinale è inappropriato. Sto cercando di ottenere un'intuizione sul perché potrebbe essere inappropriato. Penso che sia perché, in generale, una variabile ordinale non è normalmente distribuita e quindi il calcolo della media darà una rappresentazione imprecisa. Qualcuno potrebbe fornire un ragionamento più dettagliato sul perché il calcolo della media di una variabile ordinale potrebbe essere inappropriato?


8
Per calcolare una media, devi prima una somma. Perché una somma sia significativa, è necessario che 4 + 2 sia uguale a 3 + 3; equivalentemente, hai bisogno di 4-3 = 3-2 = 2-1. Con i dati ordinali - anche quando le sue categorie sono etichettate "1", "2", "3", "4" - questo non è (abbastanza esplicitamente) il caso.
Glen_b -Restate Monica

E perché la mediana dovrebbe essere più appropriata della media aritmetica?

Risposte:


24

Una risposta breve è che questo è controverso. Contrariamente ai consigli che lei menziona, le persone in molti campi usano mezzi di scale ordinali e sono spesso felici che ciò significhi fare ciò che vogliono. Le medie in gradi o l'equivalente in molti sistemi educativi ne sono un esempio.

Tuttavia, i dati ordinali non distribuiti normalmente non sono un motivo valido, perché la media è

  • ampiamente usato per distribuzioni non normali

  • ben definito matematicamente per moltissime distribuzioni non normali, tranne in alcuni casi patologici.

Potrebbe non essere una buona idea usare la media in pratica se i dati non sono distribuiti normalmente, ma questo è diverso.

Una ragione più forte per non usare la media con i dati ordinali è che il suo valore dipende dalle convenzioni sulla codifica. Codici numerici come 1, 2, 3, 4 sono generalmente scelti solo per semplicità o convenienza, ma in linea di principio potrebbero ugualmente essere 1, 23, 456, 7890 per quanto riguarda un ordine definito per quanto riguarda. Prendere la media in entrambi i casi implicherebbe prendere quelle convenzioni letteralmente (vale a dire, come se i numeri non fossero arbitrari, ma giustificabili), e non ci sono motivi rigorosi per farlo. È necessaria una scala di intervallo in cui le stesse differenze tra valori possono essere prese letteralmente per giustificare il prendere mezzi. Ritengo che sia l'argomento principale, ma come già indicato le persone spesso lo ignorano e deliberatamente, perché trovano mezzi utili, qualunque cosa affermino i teorici della misurazione.

Ecco un esempio in più. Spesso alle persone viene chiesto di scegliere uno dei "fortemente in disaccordo" ... "fortemente d'accordo" e (in parte in base a ciò che il software vuole) i ricercatori lo codificano come 1 .. 5 o 0 .. 4 o qualunque cosa vogliano, o dichiararlo come fattore ordinato (o qualunque sia il termine utilizzato dal software). Qui la codifica è arbitraria e nascosta alle persone che rispondono alla domanda.

Ma spesso anche alle persone viene chiesto (diciamo) su una scala da 1 a 5, come valuti qualcosa? Gli esempi abbondano: siti Web, sport, altri tipi di competizioni e in effetti istruzione. Qui alle persone viene mostrata una scala e viene chiesto loro di usarla. È risaputo che i non numeri interi hanno un senso, ma ti è solo permesso usare numeri interi come convenzione. Questa scala ordinale è? Alcuni dicono di sì, altri dicono di no. Altrimenti, parte del problema è che ciò che è scala ordinale è di per sé un'area confusa o dibattuta.

Considerare di nuovo i voti per il lavoro accademico, dire da E a A. Spesso tali voti sono anche trattati numericamente, dicono da 1 a 5, e di solito le persone calcolano le medie per studenti, corsi, scuole, ecc. E fanno ulteriori analisi di tali dati. Mentre è vero che qualsiasi mappatura su punteggi numerici è arbitraria ma accettabile purché mantenga l'ordine, tuttavia in pratica le persone che assegnano e ricevono i voti sanno che i punteggi hanno equivalenti numerici e sanno che i voti saranno mediati .

Una ragione pragmatica per l'uso dei mezzi è che le mediane e le modalità sono spesso scarsi riassunti delle informazioni nei dati. Supponiamo che tu abbia una scala che va da un forte disaccordo a un forte accordo e per comodità codifica i punti da 1 a 5. Ora immagina un campione codificato 1, 1, 2, 2, 2 e un altro 1, 2, 2, 4, 5. Ora solleva le tue mani se pensi che la mediana e la modalità siano gli unici riassunti giustificabili perché è una scala ordinale. Ora alza le mani se trovi utile anche la media, indipendentemente dal fatto che le somme siano ben definite, ecc.

Naturalmente, la media sarebbe un sommario ipersensibile se i codici fossero i quadrati o i cubi da 1 a 5, diciamo, e potrebbe non essere quello che vuoi. (Se il tuo obiettivo è identificare rapidamente gli high-flier, potrebbe essere esattamente quello che vuoi!) Ma è proprio per questo che la codifica convenzionale con codici interi successivi è una scelta pratica, perché spesso funziona abbastanza bene nella pratica. Questo non è un argomento che ha alcun peso con i teorici della misurazione, né dovrebbe, ma gli analisti di dati dovrebbero essere interessati a produrre riassunti ricchi di informazioni.

Concordo con chiunque affermi: utilizzare l'intera distribuzione delle frequenze dei gradi, ma non è questo il punto.


1
La risposta e il pragmatismo sono importanti, ma aggiungerei una nota di cautela. Un buon motivo per usare solo metodi stabiliti formalmente è che hai accesso a stime di certezza ecc. Ad esempio, se abbiamo due GPA, diciamo 4.53 e 4.34, potremmo voler sapere se uno è "significativamente" migliore dell'altro. Ma a causa della mancanza di formalità nella media dei voti, non otteniamo cose come intervalli di confidenza ecc.
Stephen McAteer,

1
@StephenMcAteer Vedo il tuo punto in termini di metodi insegnati in un tipico testo o corso introduttivo. Ma se questo fosse il desiderio, il bootstrap ha fornito una tecnologia che consente intervalli di confidenza da quasi 40 anni.
Nick Cox,

3

Supponiamo di prendere valori ordinali, ad esempio 1 per essere in forte disaccordo, 2 per non essere d'accordo, 3 per essere d'accordo e 4 per essere fortemente d'accordo. Se quattro persone fornissero le risposte 1, 2, 3 e 4, quale sarebbe la media? È (1 + 2 + 3 + 4) /4=2.50.

Come dovrebbe essere interpretato, quando la risposta media di quattro persone è "in disaccordo o d'accordo"? Ecco perché non dovremmo usare la media per i dati ordinali.


3
Interpretando un po 'l'avvocato del diavolo, in questo esempio interpreterei il 2.5 come a metà strada tra 2, "in disaccordo" e 3, "d'accordo". Ciò ha senso in media dato che abbiamo "fortemente in disaccordo" contro "fortemente d'accordo" e "in disaccordo" contro "d'accordo".
TooTone

1
Concordare la media di 2,5 in questo contesto ha ancora senso per me - a metà tra non essere d'accordo e concordare, o in altre parole, neutrale.
luciano,

3
Penso che Azeem abbia bisogno di un esempio più forte. Si potrebbe obiettare a 2.5 come la media di 1, 2, 3, 4 figli per famiglia per gli stessi motivi, come deve essere interpretato in quanto non è uno dei valori definiti. Ciò solleva problemi diversi.
Nick Cox,

2
Penso che tu possa rafforzare la tua risposta e ti incoraggio a farlo. "perché la media potrebbe essere un valore indefinito" non è un argomento forte qui, logicamente o psicologicamente, e non si concentra sulla questione più profonda del fatto che le differenze uguali significino davvero differenze uguali.
Nick Cox,

1
Non so come renderlo più chiaro, ma (es.) "0-4", "5-19", "20-114" sono ordinati (ordinali) in quanto esiste un solo ordine naturale per quelle misurazioni (a corto di inversione). Se vuoi chiamarle anche altre cose, per me va bene.
Nick Cox,

2

Sono totalmente d'accordo con @Azeem. Ma solo per riportare questo punto a casa, mi permetta di elaborare un po 'di più.

Supponiamo che tu abbia dati ordinali come nell'esempio di @Azeem, in cui la tua scala va da 1 a 4. E diciamo anche che hai un paio di persone che valutano qualcosa (come il gelato) su questa scala. Immagina di ottenere i seguenti risultati:

  • La persona A ha detto 4
  • La persona B ha detto 3
  • La persona C ha detto 1
  • Persona D ha detto 2

Quando vuoi interpretare i risultati, puoi concludere qualcosa nella misura di:

  • Alla persona A piaceva il gelato più della persona B
  • Alla persona D piaceva più il gelato che la persona C.

Tuttavia, non sai nulla sugli intervalli tra le valutazioni. La differenza tra 1 e 2 è uguale a quella tra 3 e 4? Un punteggio di 4 significa davvero che alla persona piace Ice Cream 4 volte di più rispetto a qualcuno che lo valuta come 1? E così via ... Quando si calcola la media aritmetica, si trattano i numeri come se le differenze tra loro fossero uguali. Ma questo è un presupposto piuttosto forte con i dati ordinali e dovresti giustificarlo.


Ho modificato il riferimento alla risposta sopra. Le risposte possono cambiare ordine e in effetti la risposta che era sopra è in questo momento sotto, e ciò può cambiare. Quindi fai riferimento ai poster, non alla posizione.
Nick Cox,

0

Concordo con l'idea che la media aritmetica non può essere veramente giustificata nei dati su scala ordinale. Invece di calcolare la media, possiamo usare la modalità o la mediana in tali situazioni che possono darci un'interpretazione più significativa dei nostri risultati.


Questo non affronta la questione del perché potrebbe essere inappropriato.
Nick Cox,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.