Test di significatività di tre o più correlazioni usando la trasformazione di Fisher


9

Seguendo i miei post precedenti, per quanto posso capire, se ho tre coefficienti di correlazione, dovrò testarli in coppia per vedere se c'è una differenza significativa tra loro.

Ciò significa che dovrei usare la trasformazione di Fishers per calcolare il punteggio z di r e quindi il valore p di z (che i calcolatori raccomandati nei post precedenti fanno, per fortuna) e quindi verificare se il valore p è superiore o inferiore a il mio valore alfa (0,05) per ogni coppia.

vale a dire se tra 21 e 30 anni è la fascia di età 1, 31-40 anni è la fascia di età 2 e 41-50 anni è la fascia di età 2, il mio confronto delle correlazioni tra le loro abitudini di acquisto e la perdita di peso sarebbe:

  • Gruppo 1 vs. Gruppo 2
  • Gruppo 1 vs. Gruppo 3
  • Gruppo 2 vs. Gruppo 3

Invece di eseguire tre calcoli separati, esiste un modo per eseguire tutti questi calcoli in un unico passaggio?


1
Potresti per favore essere un po 'più dettagliato? Come in: qual è la tua risposta, le tue variabili esplicative e quali correlazioni ti interessano? Potrebbe non essere la trasformazione di Fisher per testare la correlazione, un semplice test t potrebbe essere sufficiente.
suncoolsu,

@suncoolsu Sto testando la correlazione tra abitudine di acquisto e aumento di peso per questi tre gruppi. I miei risultati sono i seguenti: Gruppo 1: r = .8978, n = 105; Gruppo 2: r = .5678, n = 95; e gruppo 3: r = .7865, n = 120.
Adhesh Josh,

Penso che i tuoi dati superino lo IOTT. Questo è il test del trauma interoculare: ti colpisce tra gli occhi. Se le correlazioni di .9, .6 e .8 non sono diverse l'una dall'altra, che cos'è? Ma se sei davvero interessato
Peter Flom

Risposte:


4

La tua domanda è un perfetto esempio di modelli di regressione con predittori quantitativi e qualitativi . In particolare, le tre fasce di età - - sono le variabili qualitative e le variabili quantitative sono le abitudini di acquisto e la perdita di peso (immagino questo perché stai calcolando le correlazioni).1,2,&3

Devo sottolineare che questo è un modo molto migliore di modellare rispetto al calcolo di correlazioni separate a livello di gruppo perché hai più dati da modellare, quindi le tue stime di errore (valori p, ecc.) Saranno più affidabili. Un motivo più tecnico è il conseguente maggiore grado di libertà nella statistica del test t per testare il significato dei coefficienti di regressione.

Operando dalla regola secondo cui i predittori qualitativi possono essere gestiti da variabili indicatore , qui sono necessarie solo due variabili indicatore, che sono definite come segue:cc1X1,X2

X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.

Ciò implica che il gruppo è rappresentato da ; rappresentano la risposta - shopping abito come e la perdita di peso variabile esplicativa quantitativa . Ora sei adatto a questo modello lineare3X1=0,X2=0YW

E[Y]=β0+β1X1+β2X2+β3W.
La domanda ovvia è che importa se cambiamo e (perché ho scelto casualmente le abitudini di acquisto come variabile di risposta). La risposta è sì: le stime dei coefficienti di regressione cambieranno, ma il test di "associazione" tra gruppi condizionati (qui t-test, ma è lo stesso del test di correlazione per una singola variabile predittore) no modificare. specficially,WY

E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
questo equivale ad avere 3 linee distinte, a seconda dei gruppi, se si traccia vs . Questo è un buon modo per visualizzare ciò per cui stai testando ha senso (fondamentalmente una forma di EDA e controllo del modello, ma devi distinguere correttamente tra le osservazioni raggruppate). Tre linee parallele indicano nessuna interazione tra i tre gruppi e , e molta interazione implica che queste linee si intersecheranno.YWW

Come fanno i test che chiedi. Fondamentalmente, una volta che si adatta il modello e si hanno le stime, è necessario testare alcuni contrasti. In particolare per i tuoi confronti:

Group 2 vs Group 3: β2+β0β0=0,
Group 1 vs Group 3: β1+β0β0=0,
Group 2 vs Group 1: β2+β0(β0+β1)=0.

Il test per l'equivalenza delle pendenze è diverso dal test per l'equivalenza delle correlazioni. Vedi, ad esempio: jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang

Sono d'accordo, ma per una singola variabile predittore, dovrebbero essere identici a causa di questa relazione . t=ρn21ρ2tn2
suncoolsu,

Inoltre, il tuo documento parla del confronto tra diverse popolazioni, il che non è il caso del singolo predittore.
suncoolsu

Il punto è che potrebbe essere vero, mentre potrebbe essere falso (e viceversa). La correlazione tra X e Y dipende non solo da , ma anche dalla varianza in X e dalla varianza negli errori. Se la varianza in X e / o gli errori differisce tra i 3 gruppi, allora si stanno verificando diverse ipotesi. H 0 : ρ 1 = ρ 2 = ρ 3 βH0:β1=β2=β3H0:ρ1=ρ2=ρ3β
Wolfgang,

Sì, hai ragione (come ho detto prima), ma la mia risposta presuppone che l'OP fosse interessato a determinare la relazione tra wt.loss e le abitudini di acquisto in base ai gruppi (non necessariamente correlazione). Immagino di aver sbagliato perché l'OP ha accettato l'altra risposta. Tuttavia, questa risposta costituisce un'alternativa utile (spero).
suncoolsu,

1

I test a coppie in questa situazione non sono (ancora) giustificati dalla descrizione dei dati. Dovresti usare metodi di regressione multi-variabile. Una chiamata R potrebbe essere:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

Costruire 3 categorie non è il metodo migliore per controllare l'età (o analizzarne il contributo se questa è la domanda principale) poiché la categorizzazione può distorcere le relazioni continue e i termini spline rimuovono la necessità di scegliere punti di divisione arbitrari. Una volta che ci sono prove sufficienti di un'associazione di variazione di peso dopo un'analisi corretta, ci saranno opzioni di test ad hoc che possono essere implementate.

(Sono d'accordo con la maggior parte di ciò che @whuber ha espresso in un commento, e generalmente trovo il suo commento autorevole, ma non capisco la sua posizione riguardo agli approcci di regressione.)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.