Prendere la correlazione prima o dopo la trasformazione dei log delle variabili


9

Esiste un principio generale sull'opportunità di calcolare la correlazione di Pearson per due variabili casuali X e Y prima di eseguire la trasformazione del log o dopo? Esiste una procedura per verificare quale è più appropriata? Forniscono valori simili ma diversi, poiché la trasformazione del log non è lineare. Dipende dal fatto che X o Y siano più vicini alla normalità dopo il log? In tal caso, perché è importante? Ciò significa che si dovrebbe fare un test di normalità su X e Y rispetto a log (X) e log (Y) e in base a quello decidere se pearson (x, y) è più appropriato di pearson (log (x), log ( y))?


@vinux ha una buona risposta e fornisce un collegamento informativo per comprendere il ruolo della normalità nella correlazione. Volevo solo puntare a questa domanda: stats.stackexchange.com/questions/298 che è molto buono per capire cosa fanno i registri in regressione.
gung - Ripristina Monica

Risposte:


5

log(X)log(Y)XYρSρS(X,Y)=ρS(log(X),log(Y))


4

La correlazione (pearson) misura una relazione lineare tra due variabili continue. Non esiste tale scelta per (X, Y) o (registro X, registro Y). Il diagramma a dispersione delle variabili può essere utilizzato per comprendere la relazione.

Il seguente link può rispondere in merito al problema della normalità. collegamento


-3

La correlazione di Pearson è per i test parametrici ed è più potente del test non parametrico. Pertanto, optiamo per la trasformazione prima di qualsiasi procedura non parametrica. Trasforma i tuoi dati e ottieni la correlazione delle pere. Questo è tutto.


@ abi: a seconda della dimensione del campione, i coefficienti di Spearman e Kendall sono relativamente simili in termini di potenza e MSE a quelli di Pearson con dati normalmente distribuiti e sono di gran lunga superiori anche con una leggera contaminazione dei dati.
Patrick,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.