La tua domanda è un perfetto esempio di modelli di regressione con predittori quantitativi e qualitativi . In particolare, le tre fasce di età - - sono le variabili qualitative e le variabili quantitative sono le abitudini di acquisto e la perdita di peso (immagino questo perché stai calcolando le correlazioni).1,2,&3
Devo sottolineare che questo è un modo molto migliore di modellare rispetto al calcolo di correlazioni separate a livello di gruppo perché hai più dati da modellare, quindi le tue stime di errore (valori p, ecc.) Saranno più affidabili. Un motivo più tecnico è il conseguente maggiore grado di libertà nella statistica del test t per testare il significato dei coefficienti di regressione.
Operando dalla regola secondo cui i predittori qualitativi possono essere gestiti da variabili indicatore , qui sono necessarie solo due variabili indicatore, che sono definite come segue:cc−1X1,X2
X1=1 if person belongs to group 1;0 otherwise.
X2=1 if person belongs to group 2;0 otherwise.
Ciò implica che il gruppo è rappresentato da ; rappresentano la risposta - shopping abito come e la perdita di peso variabile esplicativa quantitativa . Ora sei adatto a questo modello lineare3X1=0,X2=0YW
E[Y]=β0+β1X1+β2X2+β3W.
La domanda ovvia è che importa se cambiamo e (perché ho scelto casualmente le abitudini di acquisto come variabile di risposta). La risposta è sì: le stime dei coefficienti di regressione cambieranno, ma il test di "associazione" tra gruppi condizionati (qui t-test, ma è lo stesso del test di correlazione per una singola variabile predittore) no modificare. specficially,
WY
E[Y]=β0+β3W -- for third group,
E[Y]=(β0+β2)+β3W -- for second group,
E[Y]=(β0+β1)+β3W -- for first group,
questo equivale ad avere 3 linee distinte, a seconda dei gruppi, se si traccia vs . Questo è un buon modo per visualizzare ciò per cui stai testando ha senso (fondamentalmente una forma di EDA e controllo del modello, ma devi distinguere correttamente tra le osservazioni raggruppate). Tre linee parallele indicano nessuna interazione tra i tre gruppi e , e molta interazione implica che queste linee si intersecheranno.
YWW
Come fanno i test che chiedi. Fondamentalmente, una volta che si adatta il modello e si hanno le stime, è necessario testare alcuni contrasti. In particolare per i tuoi confronti:
Group 2 vs Group 3: β2+β0−β0=0,
Group 1 vs Group 3: β1+β0−β0=0,
Group 2 vs Group 1: β2+β0−(β0+β1)=0.