Che cos'è la covarianza in un linguaggio semplice e in che modo è collegata ai termini dipendenza , correlazione e struttura della varianza-covarianza rispetto ai disegni a misure ripetute?
Che cos'è la covarianza in un linguaggio semplice e in che modo è collegata ai termini dipendenza , correlazione e struttura della varianza-covarianza rispetto ai disegni a misure ripetute?
Risposte:
La covarianza è una misura di come i cambiamenti in una variabile sono associati ai cambiamenti in una seconda variabile. In particolare, la covarianza misura il grado in cui due variabili sono associate in modo lineare. Tuttavia, è anche spesso usato in modo informale come misura generale di come siano due variabili monotonicamente correlate. Ci sono molte utili spiegazioni intuitive della covarianza qui .
Per quanto riguarda il modo in cui la covarianza è correlata a ciascuno dei termini menzionati:
(3) La struttura della varianza / covarianza (spesso chiamata semplicemente struttura della covarianza ) nei progetti di misure ripetute si riferisce alla struttura utilizzata per modellare il fatto che misurazioni ripetute su individui sono potenzialmente correlate (e quindi dipendenti) - questo viene fatto modellando il voci nella matrice di covarianza delle misurazioni ripetute. Un esempio è la struttura di correlazione intercambiabile con varianza costante che specifica che ogni misura ripetuta ha la stessa varianza e tutte le coppie di misure sono ugualmente correlate. Una scelta migliore potrebbe essere quella di specificare una struttura di covarianza che richiede due misurazioni più distanti nel tempo per essere meno correlate (ad es.un modello autoregressivo ). Si noti che il termine struttura di covarianza emerge più in generale in molti tipi di analisi multivariate in cui è possibile correlare le osservazioni.
La risposta di Macro è eccellente, ma voglio aggiungere altro a un punto su come la covarianza è correlata alla correlazione. La covarianza non ti dice davvero la forza della relazione tra le due variabili, mentre la correlazione lo fa. Per esempio:
x = [1, 2, 3]
y = [4, 6, 10]
cov(x,y) = 2 #I am using population covariance here
Ora cambiamo la scala e moltiplichiamo sia x che y per 10
x = [10, 20, 30]
y = [40, 60, 100]
cov(x, y) = 200
Cambiare la scala non dovrebbe aumentare la forza della relazione, quindi possiamo adattarci dividendo le covarianze per deviazioni standard di xey, che è esattamente la definizione del coefficiente di correlazione.
In entrambi i casi precedenti il coefficiente di correlazione tra xe y è 0.98198
.