Rango complessivo da più elenchi classificati


13

Ho esaminato un sacco di letteratura disponibile online, incluso questo forum senza fortuna e sperando che qualcuno possa aiutare un problema statistico che attualmente sto affrontando:

Ho 5 elenchi di dati classificati, ognuno contenente 10 elementi classificati dalla posizione 1 (migliore) alla posizione 10 (peggiore). Per motivi di contesto, i 10 elementi in ciascuna lista sono gli stessi, ma in diversi ordini classificati in quanto la tecnica utilizzata per decidere il loro grado è diversa.

Dati di esempio:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

Sto cercando un modo per interpretare e analizzare i dati di cui sopra in modo da ottenere un risultato finale che mostri la classifica generale di ciascun articolo in base a ciascun test e la sua posizione, ad es.

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

Finora ho tentato di interpretare queste informazioni eseguendo i test di Pearson's Correlation, Spearman's Correlation, Kendall Tau's B e Friedman. Ho scoperto, tuttavia, che questi risultati hanno generalmente associato i miei elenchi (ovvero confrontato l'elenco 1 con l'elenco 2, quindi l'elenco 1 con l'elenco 3 .. ecc.) O hanno prodotto risultati come Chi-Square, P-Values ​​ecc. Sul dati.

Qualcuno sa come posso interpretare questi dati in modo statisticamente valido (a un livello post laurea / dottorato applicabile) in modo che io possa capire i gradi complessivi segnalando l'importanza di ogni elemento nell'elenco attraverso i 5 test, per favore? Oppure, se esiste un altro tipo di tecnica o test statistico che posso esaminare apprezzerei qualsiasi suggerimento o guida.

(Forse vale anche la pena notare che ho anche eseguito le più semplici tecniche matematiche come somme, calcolo della media, test minimo - massimo ecc., Ma non credo che siano statisticamente abbastanza importanti a questo livello).

Qualsiasi aiuto o consiglio sarebbe molto apprezzato, grazie per il tuo tempo.


1
Trovo due domande che, opportunamente interpretate, sembrano duplicate (e quindi già forniscono risposte): stats.stackexchange.com/search?q=valuation+rank . Sono adeguati? In caso contrario, aiutaci a capire cosa c'è di speciale nella tua situazione.
whuber

Grazie per la risposta. Ho dato un'occhiata a questi articoli e non sono sicuro che non siano ciò che cerco o se sia colpa mia. Ho l'impressione in questi articoli che ciascuno dei set di dati abbia molte variabili con significati diversi e che i ranghi possano essere diversi o avere valori interi più dettagliati rispetto al solo grado. Sto solo cercando un modo statisticamente provato per poter dire "nel complesso l'articolo più importante è l'articolo X, seguito da Y ... e infine (o meno importante) articolo Z". Sto quasi considerando di analizzare questi ranghi 1-10 come numeri semplici
Liam

1
Un punto importante di questi thread è che non esiste alcun "modo statisticamente provato". È una questione di valutazione : qualsiasi combinazione statistica dei risultati riflette un senso di compromesso tra di loro. Ad esempio , i tuoi "oggetti" potrebbero essere automobili e le "tecniche" potrebbero classificarli in base a vari attributi: costo, consumo di carburante, potenza, comfort, ecc. Il tuo senso personale del "migliore" può differire sostanzialmente dal senso di qualcun altro e entrambi avreste ragione.
whuber

hai ricevuto la risposta? per favore lascia un commento qui stats.stackexchange.com/questions/347336/…
Ray Coder

Risposte:


7

Non sono sicuro del motivo per cui stavi esaminando correlazioni e misure simili. Non sembra esserci nulla da correlare.

Invece, ci sono una serie di opzioni, nessuna davvero migliore dell'altra, ma a seconda di ciò che vuoi:

Prendi il rango medio e quindi classifica le medie (ma questo tratta i dati come intervallo)

Prendi il rango mediano e poi classifica le mediane (ma questo può causare legami)

Prendi il numero dei voti del 1 ° posto per ogni oggetto ottenuto e classifica in base a questo

Prendi il numero dei voti dell'ultimo posto e classificali (inversamente, ovviamente) in base a quello.

Crea una combinazione ponderata di gradi, a seconda di ciò che ritieni ragionevole.


4
Un punto importante sollevato nei thread a cui ho fatto riferimento in un commento - e penso che questo sia il nocciolo dell'intero problema - è che tutti questi metodi sono arbitrari . Esistono metodi obiettivi ma richiedono l'uso di informazioni non inerenti ai dati. Questo è ciò che rende questo un problema di valutazione piuttosto che di statistica.
whuber

Quale combinazione ponderata di gradi suggeriresti?
Archie,

4

Come altri hanno sottolineato, ci sono molte opzioni che potresti perseguire. Il metodo che raccomando si basa sui ranghi medi, cioè sulla prima proposta di Peter.

In questo caso, l'importanza statistica della classifica finale può essere esaminata da un test statistico in due fasi. Questa è una procedura non parametrica che consiste nel test di Friedman con un corrispondente test post-hoc, il test di Nemenyi . Entrambi si basano su ranghi medi. Lo scopo del test di Friedman è rifiutare l'ipotesi nulla e concludere che ci sono alcune differenze tra gli articoli. In tal caso, procediamo con il test Nemenyi per scoprire quali elementi differiscono effettivamente. (Non iniziamo direttamente con il test post-hoc per evitare significati trovati per caso.)

Maggiori dettagli, come i valori critici per entrambi i test, sono disponibili nel documento di Demsar .


2

Usa Tau-x (dove la "x" si riferisce a "eXtended" Tau-b). Tau-x è l'equivalente di correlazione della metrica della distanza di Kemeny-Snell, dimostrata come la metrica della distanza unica tra gli elenchi degli oggetti classificati che soddisfa tutti i requisiti di una metrica della distanza. Vedi il capitolo 2 di "Modelli matematici nelle scienze sociali" di Kemeny e Snell, anche "Un nuovo coefficiente di correlazione di rango con l'applicazione al problema del ranking del consenso, Edward Emond, David Mason, Journal of Multi-Criteria Decision Analysis, 11: 17- 28 (2002).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.