I valori p per il test di correlazione di Pearson possono essere calcolati solo in base al coefficiente di correlazione e alla dimensione del campione?


12

Sfondo: ho letto un articolo in cui gli autori riportano la correlazione di Pearson 0.754 dalla dimensione del campione 878. Il valore p risultante per il test di correlazione è significativo "a due stelle" (cioè p <0,01). Tuttavia, penso che con una dimensione del campione così grande, il corrispondente valore p dovrebbe essere inferiore a 0,001 (cioè tre stelle significative).

  • I valori p per questo test possono essere calcolati solo dal coefficiente di correlazione di Pearson e dalla dimensione del campione?
  • Se sì, come si può fare in R?

Risposte:


14

Sì, può essere fatto se si utilizza la trasformazione R-to-z di Fisher. Altri metodi (ad esempio bootstrap) possono avere alcuni vantaggi ma richiedono i dati originali. In R ( r è il coefficiente di correlazione del campione, n è il numero di osservazioni):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

Vedi anche questo post sul mio blog .

Detto questo, che sia .01 o .001 non ha molta importanza. Come hai detto, questa è principalmente una funzione della dimensione del campione e sai già che la dimensione del campione è grande. La conclusione logica è che probabilmente non hai nemmeno bisogno di un test (in particolare non un test della cosiddetta ipotesi "zero" secondo cui la correlazione è 0). Con N = 878, puoi essere abbastanza fiducioso nella precisione del preventivo e concentrarti sull'interpretazione diretta (cioè è grande 75 nel tuo campo?).

Formalmente, tuttavia, quando si esegue un test statistico nel framework Neyman-Pearson, è necessario specificare in anticipo il livello di errore. Quindi, se i risultati del test sono davvero importanti e lo studio è stato pianificato con .01 come soglia, ha senso riportare solo p <.01 e non si dovrebbe opportunisticamente renderlo p <.001 in base al valore p ottenuto . Questo tipo di flessibilità non rivelata è anche uno dei motivi principali alla base delle critiche alle piccole stelle e, più in generale, del modo in cui le prove di significato dell'ipotesi nulla sono praticate nelle scienze sociali.

Vedi anche Meehl, PE (1978). Rischi teorici e asterischi tabulari: Sir Karl, Sir Ronald e il lento progresso della psicologia dolce. Journal of Consulting and Clinical Psychology, 46 (4), 806-834. (Il titolo contiene un riferimento a queste "stelle", ma il contenuto è una discussione molto più ampia sul ruolo del test di significatività.)


1
Probabilmente consiglierei loro di rinunciare alle stelline, anche se i risultati sono corretti ma vedo il tuo punto.
Gala,

1
Ho modificato la mia risposta per aggiungere un'osservazione su questo problema. Si noti che 0,001 <0,01 quindi gli autori sono formalmente "corretti" in ogni caso, è più una questione di ciò che implica il modo in cui i risultati sono riportati. Penso che, a differenza di un vero errore che un revisore dovrebbe ovviamente correggere, questo problema dovrebbe essere lasciato agli autori per decidere.
Gala,

1
Hai ragione, ma finora non ho mai visto riportare p <0,01 se p è in realtà inferiore a 0,001 (senza dire che il livello di confidenza per l'articolo è 0,01). Inoltre, nell'articolo di cui parlo, gli autori riportano 30 test di correlazione basati su dimensioni del campione che vanno da 837 a 886 con correlazioni che vanno da 0,145 a 0,754 e tutti sono riportati come significativi a due stelle.
Miroslav Sabo,

1
Ho un problema a pubblicare qui il mio codice, ma eseguo simulazioni e il valore p dal tuo codice non è uguale al valore p di cor.test.
Miroslav Sabo,

4
Ho scritto una recensione tutorial sull'uso di Fisher's z per le correlazioni accessibili su stata-journal.com/sjpdf.html?articlenum=pr0041 Consiglierei un uso maggiore degli intervalli di confidenza e calcolerei 0,724, 0,781 come limiti del 95%. Consiglierei ancora di più di guardare i dati e di elaborare una regressione.
Nick Cox,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.