Disclaimer: se ritieni che questa domanda sia troppo simile a un'altra, sono felice che si fonda. Tuttavia, non ho trovato una risposta soddisfacente da nessun'altra parte (e non ho ancora la "reputazione" di commentare o votare), quindi ho pensato che sarebbe meglio porre una nuova domanda da solo.
La mia domanda è questa Per ciascuno dei 12 soggetti umani, ho calcolato un coefficiente di correlazione (Spearman's rho) tra 6 livelli di una variabile indipendente X e osservazioni corrispondenti di una variabile dipendente Y. (Nota: i livelli di X non sono uguali tra i soggetti.) Mio l'ipotesi nulla è che nella popolazione generale questa correlazione sia uguale a zero. Ho testato questa ipotesi in due modi:
Utilizzando un test t di un campione sui coefficienti di correlazione ottenuti dai miei 12 soggetti.
Centrando i miei livelli di X e le osservazioni di Y in modo tale che per ciascun partecipante, media (X) = 0 e media (Y) = 0, e quindi calcolando una correlazione sui dati aggregati (72 livelli di X e 72 osservazioni di Y) .
Ora, dalla lettura del lavoro con i coefficienti di correlazione (qui e altrove) ho iniziato a dubitare che il primo approccio sia valido. In particolare, ho visto la seguente equazione apparire in diversi punti, presentata (apparentemente) come un test t per i coefficienti di corelazione medi:
dove sarebbe il coefficiente di correlazione medio (e supponiamo di averlo ottenuto utilizzando prima la trasformazione di Fisher sui coefficienti per soggetto) e n il numero di osservazioni. Intuitivamente, questo mi sembra sbagliato in quanto non include alcuna misura della variabilità tra soggetti. In altre parole, se avessi 3 coefficienti di correlazione, otterrei la stessa statistica t se fossero [0,1, 0,5, 0,9] o [0,45 0,5 0,55] o qualsiasi intervallo di valori con la stessa media (e n = 3 )
Sospetto, pertanto, che l'equazione di cui sopra non si applichi in realtà quando si verifica la significatività di una media dei coefficienti di correlazione, ma quando si verifica la significatività di un singolo coefficiente di correlazione basato su osservazioni di 2 variabili.
Qualcuno qui potrebbe confermare questa intuizione o spiegare perché è sbagliato? Inoltre, se questa formula non si applica al mio caso, qualcuno conosce un approccio corretto? O forse il mio test numero 2 è già valido? Qualsiasi aiuto è molto apprezzato (compresi i suggerimenti per le risposte precedenti che potrei aver perso o interpretato male).