Come si confrontano la gamma Goodman-Kruskal e le correlazioni Kendall tau o Spearman rho?


31

Nel mio lavoro, stiamo confrontando le classifiche previste con le classifiche vere per alcune serie di dati. Fino a poco tempo fa usavamo Kendall-Tau da solo. Un gruppo che sta lavorando a un progetto simile ha suggerito di provare a usare invece il Gamma Goodman-Kruskal e che lo hanno preferito. Mi chiedevo quali fossero le differenze tra i diversi algoritmi di correlazione dei ranghi.

La migliore che ho trovato è stata questa risposta , che afferma che Spearman è usato al posto delle solite correlazioni lineari, e che Kendall-Tau è meno diretto e assomiglia più da vicino a Goodman-Kruskal Gamma. I dati con cui sto lavorando non sembrano avere evidenti correlazioni lineari, e i dati sono fortemente distorti e non normali.

Inoltre, Spearman riporta generalmente una correlazione più elevata rispetto a Kendall-Tau per i nostri dati, e mi chiedevo cosa dicesse specificamente sui dati. Non sono uno statistico, quindi alcuni dei documenti che sto leggendo su queste cose mi sembrano un gergo, mi dispiace.


3
" Spearman generalmente riporta una migliore correlazione rispetto a Kendall-Tau per i nostri dati, e mi chiedevo cosa dicesse specificamente sui dati " ... probabilmente nulla; Kendall è spesso più vicino a 0 di ρ di Spearman quando le correlazioni non sono realmente vicine a 0 o ± 1 - misura l'associazione in modo diverso; il fatto che sia generalmente di dimensioni inferiori non significa che la correlazione di Spearman sia "migliore"; stanno solo misurando cose diverse sui dati. Cosa ti porterebbe a dire "migliore correlazione"? τρ0±1
Glen_b

1
Questo era indirettamente lo stesso della mia domanda, @Glen_b; tranne, mi chiedevo perché gli algoritmi riferissero a una correlazione più elevata e che cosa avrebbe causato questo. Cambierò "meglio" in "più alto" in modo da rendere il mio significato un po 'più chiaro. Hai ragione sul fatto che misurano cose diverse e che i numeri non hanno davvero molto a che fare l'uno con l'altro, ma volevo sapere cosa significano effettivamente i numeri, a cui viene data risposta in dettaglio di seguito.
Poik,

Risposte:


29

Spearman rho vs Kendall tau . Questi due sono così diversi dal punto di vista computazionale che non è possibile confrontare direttamente le loro dimensioni. Spearman è in genere maggiore di 1/4 a 1/3 e questo fa erroneamente concludere che Spearman è "migliore" per un determinato set di dati. La differenza tra rho e tau sta nella loro ideologia, proporzione di varianza per rho e probabilità per tau. Rho è una solita Pearson r applicata per i dati classificati e, come r, è più sensibile ai punti con grandi momenti (cioè, deviazioni dal centro nuvola) che ai punti con piccoli momenti. Pertanto rho è abbastanza sensibile alla forma del cloud dopo la classificafatto: il coefficiente per una nuvola rombica oblunga sarà più alto del coefficiente per una nuvola con manubri oblunga (perché i bordi taglienti del primo sono grandi momenti). Tau è un'estensione di Gamma ed è ugualmente sensibile a tutti i punti dati , quindi è meno sensibile alle peculiarità nella forma del cloud classificato. Tau è più "generale" di rho, poiché rho è garantito solo quando si ritiene che la relazione sottostante (modello o funzionale nella popolazione) tra le variabili sia strettamente monotona. Mentre Tau tiene conto della curva sottostante non monotonica e misura quale "tendenza" monotonica, positiva o negativa, prevale lì in generale. Rho è paragonabile a r in grandezza; Tau no.

PQ

  • P+Q
  • P+Q+Tx
  • P+Q+Ty
  • Somers 'D ("simmetrico"): media aritmetica dei due precedenti
  • Tau-b corr. Di Kendall (più adatto per tavoli quadrati): media geometrica di quei due
  • N2(k1)/(2k)
  • N(N1)/2=P+Q+Tx+Ty+Txy

PQTxTyTxyNk

r

Vedi anche su Tau e Rho.


14

Ecco una citazione di Andrew Gilpin (1993) che sostiene Maurice Kendall sul di Spearman per ragioni teoriche:τρ

[Kendall's ] si avvicina a una distribuzione normale più rapidamente di , poiché , la dimensione del campione, aumenta; e è anche matematicamente più trattabile, in particolare quando sono presenti legami. τρNτ

Non posso aggiungere molto di Goodman-Kruskal , diverso da quello che sembra produrre stime sempre così leggermente più grande di Kendall in un campione di dati di rilievo che ho lavorato con ultimamente ... e, naturalmente, notevolmente stime inferiori rispetto a di Spearman . Tuttavia, ho anche provato a calcolare un paio di stime parziali (Foraita & Sobotka, 2012), e quelle sono risultate più vicine alla parziale rispetto alla parziale ... Tuttavia, ci è voluto un bel po 'di tempo di elaborazione, quindi lascerò i test di simulazione o i confronti matematici con qualcun altro ... (chi avrebbe saputo come farli ...)γτργρτ

Come suggerisce ttnphns , non puoi concludere che le tue stime sono migliori delle tue stime solo per magnitudine, perché le loro scale differiscono (anche se i limiti no). Gilpin cita Kendall (1962) che descrive il rapporto tra e di circa 1,5 sulla maggior parte dell'intervallo di valori. Si avvicinano gradualmente man mano che le loro magnitudini aumentano, quindi quando entrambi si avvicinano a 1 (o -1), la differenza diventa infinitesimale. Gilpin fornisce una bella grande tabella di valori equivalenti di , , , d e alla terza cifra perρτρτρrr2Zrτad ogni incremento di 0,01 nel suo intervallo, proprio come ti aspetteresti di vedere all'interno della copertina di un libro di testo sulle statistiche introduttive. Ha basato questi valori sulle formule specifiche di Kendall, che sono le seguenti: (ho semplificato questa formula per dal forma in cui Gilpin ha scritto, che era in termini di Pearson's .)

r=sin(τπ2)ρ=6π(τarcsin(sin(τπ2)2))
ρr

Forse avrebbe senso convertire il tuo inτρ e vedere come il cambiamento computazionale influisce sulla stima della dimensione dell'effetto. Sembra che il confronto avrebbe dato qualche indicazione della misura in cui i problemi che di Spearman è più sensibile alle siano presenti nei dati, se non del tutto. Esistono sicuramente metodi più diretti per identificare individualmente ciascun problema specifico; il mio suggerimento produrrebbe una dimensione dell'effetto omnibus rapido e sporco per questi problemi. Se non c'è differenza (dopo aver corretto la differenza di scala), si potrebbe obiettare che non è necessario cercare ulteriormente i problemi che si applicano solo aρρ. Se c'è una differenza sostanziale, allora è probabilmente il momento di rompere la lente d'ingrandimento per determinare ciò che è responsabile.

Io non sono sicuro di come la gente di solito riportano le dimensioni dell'effetto quando si utilizza di Kendall (nella misura in cui, purtroppo limitato che la gente preoccuparsi di segnalazione dimensioni dell'effetto in generale), ma dal momento che sembra probabile che i lettori non familiari avrebbero cercato di interpretarlo sulla scala di Pearson , potrebbe essere saggio riportare sia la tua statistica che la sua dimensione dell'effetto sulla scala di usando la formula di conversione sopra ... o almeno sottolineare la differenza di scala e dare un grido a Gilpin per la sua pratica tabella di conversione .τrτr

Riferimenti

Foraita, R. e Sobotka, F. (2012). Convalida di modelli grafici. Pacchetto gmvalid, v1.23. La rete completa di archivi R. URL: http://cran.r-project.org/web/packages/gmvalid/gmvalid.pdf

Gilpin, AR (1993). Tabella per la conversione del Tau di Kendall in Rho di Spearman nel contesto delle misure di grandezza dell'effetto per la meta-analisi. Misura educativa e psicologica, 53 (1), 87-92.

Kendall, MG (1962). Metodi di correlazione del rango (3a edizione). Londra: Griffin.


9

Questi sono tutti buoni indici di associazione monotonica. Spearman's è correlato alla probabilità di concordanza della maggioranza tra terzine casuali di osservazioni, e (Kendall) e (Goodman-Kruskal) sono correlati alla concordanza a coppie. La decisione principale di fare nella scelta di vs è se si vuole penalizzare per i legami di e / o . non penalizza neanche i legami, quindi un confronto tra l'abilità predittiva di e nel predire non ricompenserà una delleρτγγτXYγX1X2YXs per essere più continuo. Questa mancanza di ricompensa lo rende un po 'incoerente con i test del rapporto di verosimiglianza basato su modelli. Una fortemente legata (diciamo una binaria ) può avere un elevato .XXγ


2
Frank, puoi spiegarlo Spearman's ρ is related to the probability of majority concordance among random triplets of observationsin modo più dettagliato, se non matematicamente difficile, se possibile? Grazie.
ttnphns,

1
L'ho letto molti anni fa, probabilmente in un testo statistico non parametrico. Non sono stato in grado di trovare il riferimento.
Frank Harrell,

1
Unfortunate ... :-( Perché l'affermazione stessa è molto intrigante.
ttnphns
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.