Intuizione dietro i nomi correlazioni 'parziali' e 'marginali'


12

Qualcuno ha un'idea del perché la correlazione condizionale tra 2 variabili è chiamata correlazione "parziale" e la semplice correlazione tra loro (quindi, quando non condizionata su qualsiasi altra variabile) è chiamata correlazione "marginale"? Qual è l'intuizione dietro le parole "parziale" e "marginale"? Cosa fanno con "parti" o "margini"?

Sarebbe bello imparare la risposta per capire meglio quei concetti.


Risposte:


11

Il termine "marginale" è molto antico. Se torni abbastanza lontano nella storia, non c'erano riviste scientifiche (evidentemente iniziarono intorno al 1665 ). Invece, i risultati intermedi sono stati comunicati tramite lettere scritte a mano e i risultati finali sono stati scritti in libri. Prima di Playfair non esisteva molto per quanto riguarda la grafica dei dati , ma i libri potrebbero avere spesso tabelle con numeri in condizioni diverse. Considera questa tabella:

ABCDIxI,AxI,BxI,CxI,DIIxII,AxII,BxII,CxII,DIIIxIII,AxIII,BxIII,CxIII,DIVxIV,AxIV,BxIV,CxIV,D
xI,AIAIx

Che cosa hanno a che fare quei numeri con le correlazioni? Bene, non è una connessione diretta, ma una volta che hai l'idea di "non tenere conto di altre variabili", e hai un nome per questo ("marginale"), quando sorge un nuovo contesto che è analogo (cioè, correlazioni) , il nome e l'idea vengono semplicemente applicati.


Non conosco l'etimologia delle correlazioni parziali, ma posso darti l'intuizione. È piuttosto semplice, davvero: hai a che fare con la correlazione tra parte di una variabile e parte di un'altra. Considera questa figura:

inserisci qui la descrizione dell'immagine

XYZr2XYXZYZXYZ

Sono appassionato di questa pagina Web per fornire una discussione di facile comprensione delle correlazioni parziali e argomenti correlati. Solo la prima sezione riguarda le correlazioni parziali di per sé, ma consiglio vivamente di leggere l'intera pagina (anche se è piuttosto lunga). Sebbene non direttamente correlato, la discussione in questo thread: dov'è la varianza condivisa tra tutti gli IV in un'equazione di regressione multipla lineare? , può anche essere utile.


1
ρ(X,Y)=ρ(Y,X)ρXY|Z=ρYX|ZρYX|Z=Area(1)Area(X(2+center))ρXY|ZρYX|ZXYXY

1
Probabilmente dovrebbe essere una nuova domanda, @KiranK. È una buona domanda e non la vogliamo seppellire nei commenti dove le persone non la troveranno mai.
gung - Ripristina Monica

Buona idea, ho ripubblicato qui come domanda: stats.stackexchange.com/questions/195410/…
Kiran K.

0

ρXYX,Y

ρXYZX,YZ

ρXYZ:=ρXYρXZρYZ1ρXZ21ρYZ2

Per illustrare le proprietà derivanti da questa definizione, possiamo considerare due casi limite:

  • XYZ

    ρXYZ=ρXY

  • YZρXY

ρXYZ=0

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.