In quali casi si dovrebbe preferire l'uno all'altro?
Ho trovato qualcuno che rivendica un vantaggio per Kendall, per motivi pedagogici , ci sono altri motivi?
In quali casi si dovrebbe preferire l'uno all'altro?
Ho trovato qualcuno che rivendica un vantaggio per Kendall, per motivi pedagogici , ci sono altri motivi?
Risposte:
Ho scoperto che la correlazione di Spearman viene utilizzata principalmente al posto della solita correlazione lineare quando si lavora con punteggi a valori interi su una scala di misurazione, quando ha un numero moderato di punteggi possibili o quando non vogliamo fare affidamento su ipotesi sulle relazioni bivariate . Rispetto al coefficiente di Pearson, l'interpretazione della tau di Kendall mi sembra meno diretta di quella del rho di Spearman, nel senso che quantifica la differenza tra la% di coppie concordanti e discordanti tra tutti i possibili eventi a coppie. Secondo la mia comprensione, la tau di Kendall assomiglia più da vicino alla gamma di Goodman-Kruskal .
Ho appena sfogliato un articolo di Larry Winner su J. Statistics Educ. (2006) che discute dell'uso di entrambe le misure, NASCAR Winston Cup Race Results per il periodo 1975-2003 .
Ho anche trovato interessante la risposta di @onestop sulla correlazione di Pearson o Spearman con dati non normali .
Da notare, tau di Kendall (la una versione) è connesso ai Somers' D (e C del Harrell) utilizzato per la modellazione predittiva (si veda ad esempio, Interpretazione Somers' D sotto quattro semplici modelli di RB Newson e riferimento 6 stessa e gli articoli di Newson pubblicato sullo Stata Journal 2006). Una panoramica dei test di somma dei ranghi è fornita nel Calcolo efficiente degli intervalli di confidenza di Jackknife per le statistiche di rango , pubblicato nel JSS (2006).
Riferisco l'onorevole gentiluomo alla mia precedente risposta : "... gli intervalli di confidenza per la S di Spearman sono meno affidabili e meno interpretabili degli intervalli di confidenza per i parametri τ di Kendall", secondo Kendall & Gibbons (1990).
Di nuovo una risposta un po 'filosofica; la differenza fondamentale è che Rho di Spearman è un tentativo di estendere l'idea di R ^ 2 (= "spiegazione della varianza") rispetto alle interazioni non lineari, mentre il Tau di Kendall è piuttosto inteso come una statistica di test per test di correlazione non lineare. Quindi, Tau dovrebbe essere usato per testare correlazioni non lineari, Rho come estensione R (o per le persone che hanno familiarità con R ^ 2 - spiegare Tau al pubblico ignaro in un tempo limitato è doloroso).
Ecco una citazione di Andrew Gilpin (1993) che sostiene la τ di Kendall sulla ρ di Spearman per ragioni teoriche:
"[Kendall's ] si avvicina a una distribuzione normale più rapidamente di , poiché , la dimensione del campione, aumenta; e è anche più tracciabile matematicamente, in particolare quando sono presenti legami."
Gilpin, AR (1993). Tabella per la conversione del Tau di Kendall in Rho di Spearman nel contesto delle misure di grandezza dell'effetto per la meta-analisi. Misura educativa e psicologica, 53 (1), 87-92.
FWIW, una citazione di Myers & Well (progetto di ricerca e analisi statistiche, seconda edizione, 2003, p. 510). Se ti preoccupi ancora dei valori p;
Seigel e Castellan (1988, statistiche non parametriche per le scienze comportamentali) sottolineano che, sebbene e Spearman avranno generalmente valori diversi quando calcolati per lo stesso set di dati, quando i test di significatività per e Spearman sono basati su le loro distribuzioni di campionamento, produrranno gli stessi valori p .