Kendall Tau o Spearman's rho?


69

In quali casi si dovrebbe preferire l'uno all'altro?

Ho trovato qualcuno che rivendica un vantaggio per Kendall, per motivi pedagogici , ci sono altri motivi?


Vedi anche una domanda correlata stats.stackexchange.com/q/18112/3277 .
ttnphns,

1
Sfortunatamente, il link nella tua domanda è morto. Presumo che ti riferisca a Noether (2007, Statistica dell'insegnamento ) . Vuoi modificarlo in?
S. Kolassa - Ripristina Monica

Risposte:


40

Ho scoperto che la correlazione di Spearman viene utilizzata principalmente al posto della solita correlazione lineare quando si lavora con punteggi a valori interi su una scala di misurazione, quando ha un numero moderato di punteggi possibili o quando non vogliamo fare affidamento su ipotesi sulle relazioni bivariate . Rispetto al coefficiente di Pearson, l'interpretazione della tau di Kendall mi sembra meno diretta di quella del rho di Spearman, nel senso che quantifica la differenza tra la% di coppie concordanti e discordanti tra tutti i possibili eventi a coppie. Secondo la mia comprensione, la tau di Kendall assomiglia più da vicino alla gamma di Goodman-Kruskal .

Ho appena sfogliato un articolo di Larry Winner su J. Statistics Educ. (2006) che discute dell'uso di entrambe le misure, NASCAR Winston Cup Race Results per il periodo 1975-2003 .

Ho anche trovato interessante la risposta di @onestop sulla correlazione di Pearson o Spearman con dati non normali .

Da notare, tau di Kendall (la una versione) è connesso ai Somers' D (e C del Harrell) utilizzato per la modellazione predittiva (si veda ad esempio, Interpretazione Somers' D sotto quattro semplici modelli di RB Newson e riferimento 6 stessa e gli articoli di Newson pubblicato sullo Stata Journal 2006). Una panoramica dei test di somma dei ranghi è fornita nel Calcolo efficiente degli intervalli di confidenza di Jackknife per le statistiche di rango , pubblicato nel JSS (2006).


Grazie chl per la risposta, l'ho accettato per il solo scopo. Meglio, Tal
Tal Galili,

Spearman usava regolarmente due variabili intere per confrontare i legami, che sembrano essere gestiti meglio dalla tau di Kendall.
vinnief

29

Riferisco l'onorevole gentiluomo alla mia precedente risposta : "... gli intervalli di confidenza per la S di Spearman sono meno affidabili e meno interpretabili degli intervalli di confidenza per i parametri τ di Kendall", secondo Kendall & Gibbons (1990).


1
Penso che i ringraziamenti siano dovuti a Roger Newson, poiché sto solo citando il suo articolo.
onestop,

22

Di nuovo una risposta un po 'filosofica; la differenza fondamentale è che Rho di Spearman è un tentativo di estendere l'idea di R ^ 2 (= "spiegazione della varianza") rispetto alle interazioni non lineari, mentre il Tau di Kendall è piuttosto inteso come una statistica di test per test di correlazione non lineare. Quindi, Tau dovrebbe essere usato per testare correlazioni non lineari, Rho come estensione R (o per le persone che hanno familiarità con R ^ 2 - spiegare Tau al pubblico ignaro in un tempo limitato è doloroso).


6
potresti spiegare "interazioni non lineari". Lo Spearman Rho sembra riflettere una misura del coefficiente di validità in termini di psicometria. Non conosco la natura di Tau.
Subhash C. Davar,

Non capisco la cosa della psicometria del tuo commento.
Léo Léopold Hertz

1
xx2

1
Questo è vero solo quando x non è negativo.
aocall

17

Ecco una citazione di Andrew Gilpin (1993) che sostiene la τ di Kendall sulla ρ di Spearman per ragioni teoriche:

"[Kendall's ] si avvicina a una distribuzione normale più rapidamente di , poiché , la dimensione del campione, aumenta; e è anche più tracciabile matematicamente, in particolare quando sono presenti legami." τρNτ

Riferimento

Gilpin, AR (1993). Tabella per la conversione del Tau di Kendall in Rho di Spearman nel contesto delle misure di grandezza dell'effetto per la meta-analisi. Misura educativa e psicologica, 53 (1), 87-92.


3

FWIW, una citazione di Myers & Well (progetto di ricerca e analisi statistiche, seconda edizione, 2003, p. 510). Se ti preoccupi ancora dei valori p;

Seigel e Castellan (1988, statistiche non parametriche per le scienze comportamentali) sottolineano che, sebbene e Spearman avranno generalmente valori diversi quando calcolati per lo stesso set di dati, quando i test di significatività per e Spearman sono basati su le loro distribuzioni di campionamento, produrranno gli stessi valori p .τρτρ


Sai se offrono qualche supporto per questo reclamo? Non vedo come in realtà possa essere vero in generale (possono essere abbastanza spesso simili, ma in realtà non vedo come l'affermazione che saranno gli stessi può reggere). [Mi chiedo se Siegel e Castellan
abbiano

Ho controllato Siegel & Castellan (2ed p253). Dicono qualcosa di leggermente diverso ... ma in realtà è leggermente peggio della precedente parafrasi, anche con l'aggiunta di "approssimativamente" (peggio perché lo limitano ad essere il caso sotto il null, ma dal momento che stanno condizionando i dati ciò non aiuta. Comunque, per un ordine fisso di , tutti i possibili ordini di rango di sono ugualmente probabili sotto H0.) Il fatto che pensino che il condizionamento sul nulla dopo il condizionamento sui dati sia preoccupante. Mi chiedo se intendessero dire qualcos'altro o se fraintendono davveroxy
Glen_b

Come controesempio, prendi n = 7 e valori p esatti. Sia x = 1,2,3,4,5,6,7 e sia y = 2,1,4,3,7,6,5 ... spearman dà p = 0,048, Kendall dà 0,136 ... che sono per niente simile. Una disposizione diversa dà lo stesso valore per kendall ma spearman ha p = 0,302. Ci sono molti esempi simili e varie dimensioni del campione
Glen_b

3
Ecco una trama per il caso n = 8. Come vedi c'è molta variazione tra i valori p per le due misure di correlazione: i.stack.imgur.com/5JMbj.png ... Potrei scrivere una
domanda

1
Ecco due set di dati di esempio (dopo il ranking) che mostrano due casi (questa volta con n = 9) in cui i valori p di correlazione di Spearman sono gli stessi, ma i valori p di correlazione di Kendall sono abbastanza diversi: i.stack.imgur. com / 3ILD8.png
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.