Se ho due variabili casuali indipendenti X e Y, qual è la correlazione tra X e il prodotto XY? Se questo è sconosciuto, sarei interessato a sapere almeno cosa succede nel caso specifico di X e Y normali con zero media, se è più facile da risolvere.
Se ho due variabili casuali indipendenti X e Y, qual è la correlazione tra X e il prodotto XY? Se questo è sconosciuto, sarei interessato a sapere almeno cosa succede nel caso specifico di X e Y normali con zero media, se è più facile da risolvere.
Risposte:
Ritengo che una valida soluzione sarà quella che esprime - se possibile - la correlazione in termini di proprietà separati delle variabili e Y . Calcolare la correlazione coinvolgerà calcolare le covarianze di monomi in X e Y . È economico farlo tutto in una volta. Osservalo semplicemente
Quando e Y sono indipendenti e i e j sono poteri, allora X i e Y j sono indipendenti;
L'aspettativa di un prodotto di variabili indipendenti è il prodotto delle loro aspettative.
Questo darà le formule in termini di momenti di e Y .
Questo è tutto quello che c'è da fare.
Scrivi , ecc. Per i momenti. Pertanto, per tutti i numeri i , j , k , l per i quali i calcoli hanno senso e producono numeri finiti,
Nota che la varianza di qualsiasi variabile casuale è la sua covarianza con se stessa, quindi non dobbiamo fare alcun calcolo speciale per le varianze.
Ora dovrebbe essere ovvio come calcolare i momenti che coinvolgono monomi, di qualsiasi potere, di qualsiasi numero finito di variabili casuali indipendenti. Come applicazione, applica questo risultato alla definizione di correlazione, che è la covarianza divisa per le radici quadrate delle varianze:
Esistono varie semplificazioni algebriche che potresti scegliere se desideri metterle in relazione con aspettative, varianze e covarianze delle variabili originali, ma realizzarle qui non fornirebbe ulteriori informazioni.
Utilizzando la legge della covarianza totale e dell'indipendenza di e Y , Cov ( X , X Y ) Usando la legge della varianza totale e, di nuovo, l'indipendenza, Var ( X Y )
Un controllo di questo risultato mediante simulazione:
> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373
La correlazione lineare tra X e XY sarà,
Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))
Cov (X, XY) = Somma ((media X (X)) (media XY (XY)) / n
n - dimensione del campione; var (X) = varianza di X; var (XY) = varianza di XY