quando ho eseguito alcuni esempi, i valori p per rho e per il test t della correlazione dei ranghi di Pearson sono sempre stati abbinati, salvo per le ultime cifre
Bene, allora hai fatto degli esempi sbagliati!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
Vettori a
e b
hanno una buona, ma lungi dall'essere perfetto lineare (Pearson) correlazione. Tuttavia, hanno una perfetta correlazione tra gradi. See - al di Spearman , in questo caso, non importa se l'ultima cifra del è 8.1, 9, 90 o 9000 (! Provare), importa solo se è maggiore di 8 . Ecco cosa fa la differenza tra i ranghi correlati. ρb
Viceversa, mentre a
e b
hanno correlazione di rango perfetta, loro coefficiente di correlazione di Pearson è minore di 1. Questo dimostra che la correlazione Pearson non sta riflettendo ranghi.
Una correlazione di Pearson riflette una funzione lineare, una correlazione di rango semplicemente una funzione monotona. Nel caso dei dati normali, i due si assomigliano fortemente, e sospetto che questo sia il motivo per cui i tuoi dati non mostrano grandi differenze tra Spearman e Pearson.
Per un esempio pratico, considerare quanto segue; vuoi vedere se le persone più alte pesano di più. Sì, è una domanda sciocca ... ma supponi che questo sia ciò che ti interessa. Ora, la massa non si ridimensiona linearmente con il peso, poiché anche le persone alte sono più larghe delle persone piccole; quindi il peso non è una funzione lineare dell'altezza. Qualcuno che è il 10% più alto di te è (in media) più del 10% più pesante. Questo è il motivo per cui l'indice corpo / massa utilizza il cubo nel denominatore.
Di conseguenza, assumeresti una correlazione lineare per riflettere in modo impreciso la relazione altezza / peso. Al contrario, la correlazione tra gradi è insensibile alle fastidiose leggi della fisica e della biologia in questo caso; non riflette se le persone diventano più pesanti linearmente man mano che aumentano in altezza, riflette semplicemente se le persone più alte (più alte di rango su una scala) sono più pesanti (più alte di rango sull'altra scala).
Un esempio più tipico potrebbe essere quello delle classifiche di questionari simili a quelle di Likert, come le persone che valutano qualcosa come "perfetto / buono / decente / mediocre / cattivo / terribile". "perfetto" è tutt'altro che "decente" come "decente" è da "cattivo" sulla scala , ma possiamo davvero dire che la distanza tra i due è la stessa? Una correlazione lineare non è necessariamente appropriata. La correlazione tra gradi è più naturale.
Per rispondere più direttamente alla tua domanda: no, i valori p per le correlazioni di Pearson e Spearman non devono essere calcolati in modo diverso . Molto è diverso nei due, sia concettualmente che numericamente, ma se la statistica del test è equivalente, il valore p sarà equivalente.
Sulla questione di un'ipotesi di normalità nella correlazione di Pearson, vedi questo .
Più in generale, altre persone hanno elaborato molto meglio di quanto potessi riguardo all'argomento delle correlazioni parametriche rispetto a quelle non parametriche (vedi anche qui ), e cosa questo significhi riguardo alle ipotesi distributive.