Una risposta breve è che questo è controverso. Contrariamente ai consigli che lei menziona, le persone in molti campi usano mezzi di scale ordinali e sono spesso felici che ciò significhi fare ciò che vogliono. Le medie in gradi o l'equivalente in molti sistemi educativi ne sono un esempio.
Tuttavia, i dati ordinali non distribuiti normalmente non sono un motivo valido, perché la media è
ampiamente usato per distribuzioni non normali
ben definito matematicamente per moltissime distribuzioni non normali, tranne in alcuni casi patologici.
Potrebbe non essere una buona idea usare la media in pratica se i dati non sono distribuiti normalmente, ma questo è diverso.
Una ragione più forte per non usare la media con i dati ordinali è che il suo valore dipende dalle convenzioni sulla codifica. Codici numerici come 1, 2, 3, 4 sono generalmente scelti solo per semplicità o convenienza, ma in linea di principio potrebbero ugualmente essere 1, 23, 456, 7890 per quanto riguarda un ordine definito per quanto riguarda. Prendere la media in entrambi i casi implicherebbe prendere quelle convenzioni letteralmente (vale a dire, come se i numeri non fossero arbitrari, ma giustificabili), e non ci sono motivi rigorosi per farlo. È necessaria una scala di intervallo in cui le stesse differenze tra valori possono essere prese letteralmente per giustificare il prendere mezzi. Ritengo che sia l'argomento principale, ma come già indicato le persone spesso lo ignorano e deliberatamente, perché trovano mezzi utili, qualunque cosa affermino i teorici della misurazione.
Ecco un esempio in più. Spesso alle persone viene chiesto di scegliere uno dei "fortemente in disaccordo" ... "fortemente d'accordo" e (in parte in base a ciò che il software vuole) i ricercatori lo codificano come 1 .. 5 o 0 .. 4 o qualunque cosa vogliano, o dichiararlo come fattore ordinato (o qualunque sia il termine utilizzato dal software). Qui la codifica è arbitraria e nascosta alle persone che rispondono alla domanda.
Ma spesso anche alle persone viene chiesto (diciamo) su una scala da 1 a 5, come valuti qualcosa? Gli esempi abbondano: siti Web, sport, altri tipi di competizioni e in effetti istruzione. Qui alle persone viene mostrata una scala e viene chiesto loro di usarla. È risaputo che i non numeri interi hanno un senso, ma ti è solo permesso usare numeri interi come convenzione. Questa scala ordinale è? Alcuni dicono di sì, altri dicono di no. Altrimenti, parte del problema è che ciò che è scala ordinale è di per sé un'area confusa o dibattuta.
Considerare di nuovo i voti per il lavoro accademico, dire da E a A. Spesso tali voti sono anche trattati numericamente, dicono da 1 a 5, e di solito le persone calcolano le medie per studenti, corsi, scuole, ecc. E fanno ulteriori analisi di tali dati. Mentre è vero che qualsiasi mappatura su punteggi numerici è arbitraria ma accettabile purché mantenga l'ordine, tuttavia in pratica le persone che assegnano e ricevono i voti sanno che i punteggi hanno equivalenti numerici e sanno che i voti saranno mediati .
Una ragione pragmatica per l'uso dei mezzi è che le mediane e le modalità sono spesso scarsi riassunti delle informazioni nei dati. Supponiamo che tu abbia una scala che va da un forte disaccordo a un forte accordo e per comodità codifica i punti da 1 a 5. Ora immagina un campione codificato 1, 1, 2, 2, 2 e un altro 1, 2, 2, 4, 5. Ora solleva le tue mani se pensi che la mediana e la modalità siano gli unici riassunti giustificabili perché è una scala ordinale. Ora alza le mani se trovi utile anche la media, indipendentemente dal fatto che le somme siano ben definite, ecc.
Naturalmente, la media sarebbe un sommario ipersensibile se i codici fossero i quadrati o i cubi da 1 a 5, diciamo, e potrebbe non essere quello che vuoi. (Se il tuo obiettivo è identificare rapidamente gli high-flier, potrebbe essere esattamente quello che vuoi!) Ma è proprio per questo che la codifica convenzionale con codici interi successivi è una scelta pratica, perché spesso funziona abbastanza bene nella pratica. Questo non è un argomento che ha alcun peso con i teorici della misurazione, né dovrebbe, ma gli analisti di dati dovrebbero essere interessati a produrre riassunti ricchi di informazioni.
Concordo con chiunque affermi: utilizzare l'intera distribuzione delle frequenze dei gradi, ma non è questo il punto.