Visualizzazione dei dati ordinali: medie, mediane e ranghi medi


11

Ho alcuni dati ordinali che non sono normalmente distribuiti, quindi ho deciso di fare test non parametrici usando il test U di Mann-Whitney. Sto osservando le differenze tra i gruppi per sette punteggi: questi punteggi sono 0, 1, 2 o 3 per ogni argomento. Sto avendo difficoltà a capire come visualizzare i miei dati!

Se presento i dati usando le mediane (e il QI delle mediane), non è affatto chiaro dove siano le differenze perché per la maggior parte le mediane cadono su 0 o 1. Quindi, nonostante il test U di Mann-Whitney mostra differenze significative, il tavolo sembra poco interessante.

Potrei anche presentare i dati usando i mezzi . Esistono alcuni documenti scientifici che affermano che è possibile utilizzare i mezzi con i dati ordinali, ma che non è possibile fare lo stesso tipo di ipotesi sulle differenze tra i punteggi (ad esempio, la differenza tra 0 e 1 non è la stessa tra 1 e 2). L'uso dei mezzi sarebbe un po 'controverso, anche se i numeri nella tabella raccontano bene la storia quando li uso.

Una terza opzione sta usando i ranghi medi che SPSS mi fornisce nell'output del Mann-Whitney. I ranghi medi sono ciò che viene confrontato tra i gruppi, quindi forse dovrei semplicemente usarli? L'unico problema che ho con questo è che i ranghi medi non significano davvero nulla rispetto ai dati reali (ad esempio non riesco a vedere che i soggetti sono più vicini a un 3 mentre i controlli sono più vicini a un 1 usando i ranghi medi.)

E un'ultima opzione era eseguire un'analisi chi-quadro confrontando soggetti e controlli dopo aver diviso i punteggi in due gruppi (0 e 1 per il minimo e 2 e 3 per il massimo). Tuttavia, quando l'ho fatto, le differenze non erano così pronunciate (probabilmente per una serie di motivi).


Stai chiedendo come presentare al meglio i tuoi dati nel testo, in una tabella o in una figura?
gung - Ripristina Monica

Sia testo che tabella. Nel testo sto per dire che c'erano differenze significative tra i gruppi su diversi componenti del mio sondaggio sul sonno. Queste differenze sono attraverso un test di Mann-Whitney, quindi stanno confrontando i ranghi medi. Quello che non so è come dovrei presentare queste differenze in una tabella. L'uso delle mediane non funziona perché sono troppo simili e non puoi vedere le differenze. I mezzi funzionano meglio, ma sembra strano usare misure parametriche in una tabella che dovrebbe riguardare le mediane non parametriche. E i ranghi medi funzionerebbero, ma non rappresentano valori reali.
Eric

1
Mi chiedo se alcune risposte di Graph per la relazione tra due variabili ordinali possano essere adattate ai tuoi scopi? I grafici di esempio mostrano la relazione tra due variabili ciascuna con cinque livelli, ma se si stanno confrontando, ad esempio, due gruppi e si hanno quattro livelli possibili, è possibile reinventare alcune di queste visualizzazioni come 4 per 2 anziché 5 per 5, forse.
Silverfish

Potrebbe essere utile se tu potessi pubblicare alcuni dati di esempio (forse del tutto fasulli), in modo che le persone che vogliono dimostrare una possibile tecnica abbiano qualcosa con cui lavorare.
Silverfish

1
Eric, per definizione un test non parametrico, in particolare Mann-Whitney, confronta (per il dominio) due distribuzioni in generale, non confronta un valore di parametro specifico di una distribuzione, come media o mediana. Non esiste un singolo numero che è una caratteristica di una distribuzione e allo stesso tempo è ciò che viene confrontato, in questo caso. È possibile utilizzare lo stimatore a 2 campioni di Hodges-Lehmann, ma è la caratteristica della differenza tra due distribuzioni e non di ciascuna delle due distribuzioni.
ttnphns,

Risposte:


8

1,2,=3

La correttezza dell'uso della media per sintetizzare le variabili ordinali raramente può venire dai dati stessi. È soggettivo.

Dxyγxy


1
Ciao Frank, grazie per la tua premurosa risposta. Se non ti dispiace, ho un paio di domande di follow-up. Per quanto riguarda i mezzi, credo che le categorie siano almeno a metà significative, in quanto si riferiscono essenzialmente a "danno lieve, moderato e grave", rispettivamente. Ci sono riferimenti che conosci che potrei essere in grado di usare come precedente per questo? Sono anche riluttante a usare i mezzi in una sola tabella e le mediane in altre per motivi di coerenza. E per i ranghi medi - credo di confrontare gruppi - soggetti e controlli su 7 punteggi. Il confronto dei ranghi medi è accettabile / utile?
Eric

Per i dati ordinali numerici con pochi livelli, come conteggi e forse il tuo esempio di compromissione, i mezzi sono utili e le mediane no (a causa di troppi legami). Ci sono molte occasioni in cui ho usato mezzi per dati ordinali e mediane per quelli continui obliqui, nella stessa tabella.
Frank Harrell,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.