Esempi di dati indipendenti e non correlati nella vita reale e modi per misurarli / rilevarli


20

Sentiamo sempre parlare di questo vettore di dati VS questo altro vettore di dati è indipendente l'uno dall'altro, o non correlato, ecc., E mentre è facile imbattersi in matematica riguardo a questi due concetti, voglio legarli in esempi dal reale- vita, e anche trovare modi per misurare questa relazione.

Da questo punto di vista, sto cercando esempi di due segnali che sono delle seguenti combinazioni: (Inizierò con alcuni):

  • Due segnali indipendenti E (necessariamente) non correlati:

    • Il rumore di un motore di un'auto (chiamalo ) e la tua voce ( ) mentre parli.v 2 [ n ]v1[n]v2[n]
    • Una registrazione dell'umidità ogni giorno ( ) e l'indice dow-jones ( ).v 2 [ n ]v1[n]v2[n]

Q1) Come misureresti / dimostreresti che sono indipendenti con quei due vettori in mano? Sappiamo che l'indipendenza significa che il prodotto dei loro pdf è uguale al loro pdf congiunto, ed è grandioso, ma con quei due vettori in mano, come si può dimostrare la loro indipendenza?

  • Due segnali NON indipendenti, ma ancora non correlati:

Q2) Non riesco a pensare ad alcun esempio qui ... quali sarebbero alcuni esempi? So che possiamo misurare la correlazione prendendo la correlazione incrociata di due di questi vettori, ma come dimostreremmo che NON sono indipendenti?

  • Due segnali correlati:
    • Un vettore che misura la voce di un cantante d'opera nella sala principale, , mentre qualcuno registra la sua voce da qualche parte all'interno dell'edificio, diciamo nella sala prove ( ).v 2 [ n ]v1[n]v2[n]
    • Se misuri continuamente la tua frequenza cardiaca in macchina, ( ), e misuri anche l'intensità delle luci blu che si infrangono sul parabrezza posteriore ( ) ... Immagino che sarebbero molto correlate. . :-)v 2 [ n ]v1[n]v2[n]

D3) Relativo a q2, ma nel caso della misurazione della correlazione incrociata da questo punto di vista empirico, è sufficiente esaminare il prodotto punto di quei vettori (poiché quello è il valore al picco della loro correlazione incrociata)? Perché dovremmo preoccuparci di altri valori nella funzione cross-corr?

Grazie ancora, più esempi danno il meglio per la costruzione dell'intuizione!


@DilipSarwate Grazie Dilip, lo darò un'occhiata. Per ora alcuni esempi sarebbero buoni però.
Spacey,

Non puoi "dimostrare" che sono indipendenti allo stesso modo in cui anche un sondaggio ben costruito non può "dimostrare" come tutti voteranno, e per le stesse ragioni.
Jim Clay,

@JimClay Sentiti libero di rilassare il criterio 'prova' - quello che sto cercando di ottenere sono i modi per misurare / quantificare l'indipendenza. Ne sentiamo spesso parlare e quindi essere indipendenti, beh, come lo sanno? Quale nastro di misurazione viene utilizzato?
Spacey,

Vorrei sapere se la corelazione cros può essere utilizzata per due segnali analogici uno ad alta risoluzione e l'altro a bassa risoluzione a scopo di analisi.

Se abbiamo qualche variabile casuale X e segnali del costrutto 2 a ** = (x) e ** b ** = f 2 (x) con f 1 e f 2 ortogonali e ** x = a + bf1f2f1f2 . Ciò implicherebbe che tali segnali sono indipendenti? Ciò richiede alcune condizioni aggiuntive? Questa proprietà sarebbe interessante perché evita la costruzione di pdf congiunti di a e b .
Mladen,

Risposte:


9

Alcuni elementi ... (So che questo non è esaustivo, una risposta più completa dovrebbe probabilmente menzionare i momenti)

Q1

Per verificare se due distribuzioni sono indipendenti, è necessario misurare quanto sia simile la loro distribuzione congiunta al prodotto della loro distribuzione marginale p ( x ) × p ( y ) . A tale scopo, è possibile utilizzare qualsiasi distanza tra le distribuzioni. Se si utilizza la divergenza di Kullback-Leibler per confrontare tali distribuzioni, si considererà la quantità:p(x,y)p(x)×p(y)

xyp(x,y)logp(x,y)p(x)p(y)dxdy

E avrai riconosciuto ... le informazioni reciproche! Più è basso, più sono indipendenti le variabili.

Più in pratica, per calcolare questa quantità dalle tue osservazioni, puoi stimare le densità , p ( y ) , p ( x , y ) dai tuoi dati usando uno stimatore di densità del Kernel e fare un'integrazione numerica su una griglia fine ; o semplicemente quantificare i dati in N bin e utilizzare l'espressione delle Informazioni reciproche per distribuzioni discrete.p(x)p(y)p(x,y)N

Q2

Dalla pagina di Wikipedia sull'indipendenza e la correlazione statistiche:

Trame di distribuzione

p(x,y)p(x)p(y)

Q3

Esistono effettivamente situazioni in cui è possibile esaminare tutti i valori delle funzioni di correlazione incrociata. Si presentano, ad esempio, nell'elaborazione del segnale audio. Considera due microfoni che catturano la stessa fonte, ma distanti da pochi metri. La correlazione incrociata dei due segnali avrà un picco elevato nel ritardo corrispondente alla distanza tra i microfoni divisa per la velocità del suono. Se guardi la correlazione incrociata al ritardo 0, non vedrai che un segnale è una versione spostata nel tempo dell'altro!


p(x,y)p(x}

(contd) 2) Quindi per riassumere: se la matrice di covarianza di xe y è diagonale, allora sono non correlate, ma NON necessariamente indipendenti? Testare l'indipendenza era il problema con la domanda di follow-up (1). Tuttavia, se dimostriamo che sono indipendenti, ovviamente la loro matrice di covarianza DEVE essere diagonale. Ho capito bene? Qual è un esempio di 2 segnali fisici che posso misurare nella vita reale che sarebbero dipendenti, ma non correlati? Grazie ancora.
Spacey,

1
xnynNp(x,y)p(x,y)=i1NK(xxi,yyi)K(xn,yn)p(x,y)=CNC(x,y)

1
"2 segnali fisici che sarebbero dipendenti, ma non correlati": Diciamo che hackeriamo il GPS di una cabina di New York per registrare una storia (latitudine, longitudine) della sua posizione. C'è una buona probabilità che il lat., A lungo. i dati non saranno correlati - non esiste un "orientamento" privilegiato della nuvola di punti. Ma difficilmente sarà indipendente, poiché, se ti fosse chiesto di indovinare la latitudine del taxi, forniresti una supposizione molto migliore se conoscessi la longitudine (potresti quindi guardare una mappa e escludere il [lat, lunghe] coppie occupate da edifici).
Pichenettes,

Un altro esempio: due onde sinusoidali su un multiplo intero della stessa frequenza. Correlazione nulla (la base di Fourier è ortonormale); ma se conosci il valore di uno c'è solo un insieme finito di valori che l'altro può prendere (pensa a un diagramma di Lissajous).
Pichenettes,

5

È molto difficile stabilire se due segnali siano indipendenti (date osservazioni finite) senza alcuna conoscenza / ipotesi precedenti.

XYXYYXY

cov(f1(X),f2(Y))=E(f1(X),f2(Y))=0
f1f2XYf1(x)=f2(x)=x

E(XiYj)

X(t)Y(t)

SX,Y(f),SX2,Y(f),SX,Y2(f)
f

Esempio :

X(t)=sin(2πft)
Y(t)=sin(2πftk)
kZk1X(t)Y(t)sin(kx)sin(x)
Y(t)=f(X(t))
f

X(t)Y(t)


Xx2,Y(f)

X2(t)Y(t)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.