C'è qualche relazione tra somiglianza del coseno, correlazione di Pearson e punteggio z?


16

Mi chiedo se ci sia qualche relazione tra queste 3 misure. Non riesco a stabilire una connessione tra di loro facendo riferimento alle definizioni (forse perché sono nuovo di queste definizioni e mi sto divertendo un po 'a comprenderle).

So che l'intervallo della somiglianza del coseno può essere compreso tra 0 e 1 e che la correlazione di Pearson può variare tra -1 e 1 e non sono sicuro sull'intervallo del punteggio z.

Non so, tuttavia, come un certo valore di somiglianza del coseno potrebbe dirti qualcosa sulla correlazione di Pearson o sul punteggio z e viceversa?


1
z punteggio di cosa ? i punteggi z di alcune cose potrebbero essere correlati alla correlazione di Pearson, i punteggi Z di altre cose no. Ad esempio, se standardizzi internamente le tue variabili originali, la correlazione di Pearson tra xey è il prodotto atteso dei loro punteggi z. Oppure potresti parlare di punteggi z delle correlazioni di Pearson (correlazioni di Pearson meno la loro aspettativa in una condizione tutte divise dall'errore standard della correlazione di Pearson), che sarebbero certamente correlate alla correlazione di Pearson.
Glen_b -Restate Monica

Risposte:


29

La somiglianza coseno tra due vettori un' e B è solo l'angolo tra loro

cosθ=abab
In molte applicazioni che usano la somiglianza del coseno, i vettori sono non negativi (ad es. Un termine vettore di frequenza per un documento), e in questo caso anche la somiglianza del coseno sarà non negativa.

Per un vettore il vettore " punteggio z " viene generalmente definito come z = x - ˉ xXz dove ˉ x =1

z=x-X¯SX
es 2 x = ¯ ( x - ˉ x ) 2 sono la deviazione media e standard dix. Quindizha media 0 e deviazione standard 1, ovverozxè laversionestandardizzatadix.X¯=1nΣioXioSX2=(X-X¯)2¯XzzXX

Per due vettori ed y , il coefficiente di correlazione sarebbe ρ x , y = ¯ ( z x z y )Xy

ρX,y=(zXzy)¯

Ora se il vettore ha zero media, la sua varianza sarà s 2 a = 1un', per cui il suo vettore unitario e z-score verranno riportate da un =unSun'2=1nun'2

un'^=un'un'=zun'n

un'B

n


+1. commento latexnazi: \|spesso sembra migliore di ||ed \lVert ... \rVertè il modo migliore per scriverlo.
ameba dice Ripristina Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.