Intuizione (geometrica o altro) di


18

Considera l'identità elementare della varianza:

Var(X)=E[(XE[X])2]=...=E[X2](E[X])2

È una semplice manipolazione algebrica della definizione di un momento centrale in momenti non centrali.

Consente una comoda manipolazione di in altri contesti. Consente inoltre il calcolo della varianza tramite un singolo passaggio sui dati anziché due passaggi, prima per calcolare la media, quindi per calcolare la varianza.Var(X)

Ma cosa significa ? Per me non esiste un'intuizione geometrica immediata che mette in relazione la diffusione sulla media per diffondersi intorno a 0. Dato che è un insieme su una singola dimensione, come vedi la diffusione attorno a una media come la differenza tra la diffusione attorno all'origine e il quadrato del significare?X

Esistono buone interpretazioni algebriche lineari o interpretazioni fisiche o altro che possano dare un'idea di questa identità?


7
Suggerimento: questo è il teorema di Pitagora.
whuber

1
@Matthew Mi chiedo cosa significhi " ". Sospetto che non sia un'aspettativa, ma solo una scorciatoia per la media aritmetica. Altrimenti le equazioni sarebbero errate (e quasi prive di significato, poiché avrebbero quindi equiparato le variabili casuali con i numeri). E
whuber

2
@whuber Poiché i prodotti interni introducono l'idea di distanze e angoli, e il prodotto interno dello spazio vettoriale delle variabili casuali a valore reale è definito come (?), mi chiedo se un'intuizione geometrica possa essere data tramite la disuguaglianza del triangolo. Non ho idea di come procedere, ma mi chiedevo se avesse un senso. E[XY]
Antoni Parellada,

1
@Antoni La disuguaglianza del triangolo è troppo generale. Un prodotto interno è un oggetto molto più speciale. Fortunatamente, l'intuizione geometrica appropriata è precisamente quella della geometria euclidea. Inoltre, anche nel caso di variabili casuali e Y , la geometria necessaria può essere limitata allo spazio vettoriale reale bidimensionale generato da X e Y : cioè sul piano euclideo stesso. Nella presente istanza X non sembra essere un camper: è solo un n- vettore. Qui, lo spazio attraversato da X e ( 1 , 1 , ... , 1 )XYXYXnX(1,1,,1)è il piano euclideo in cui avviene tutta la geometria.
whuber

3
Impostazione β 1 = 0 nella risposta ho collegato a, e dividendo tutti i termini da n (se lo si desidera) vi darà la soluzione algebrica completa per la varianza: non c'è alcun motivo per copiare tutto da capo. Questo perché β 0 è la media aritmetica di y , dove | | y - y | | 2 è solo n volte la varianza come è stata definita qui, | | y | | 2 è n volte la media aritmetica al quadrato e |β^1=0nβ^0y||yy^||2n||y^||2n è n volte la media aritmetica dei valori quadrati. ||y||2n
whuber

Risposte:


21

Espandendo il punto @ whuber nei commenti, se e Z sono ortogonali, si ha il Teorema di Pitagora :YZ

Y2+Z2=Y+Z2

Osserva che è un prodotto interno valido e che è la norma indotta da quel prodotto interno .Y = Y,ZE[YZ]Y=E[Y2]

Lascia che sia una variabile casuale. Sia , Sia . Se e sono ortogonali:Y = E [ X ] Z = X - E [ X ] Y ZXY=E[X]Z=XE[X]YZ

Y2+Z2=Y+Z2E[E[X]2]+E[(XE[X])2]=E[X2]E[X]2+Var[X]=E[X2]

Ed è facile dimostrare che e sono ortogonali sotto questo prodotto interno:Z = X - E [ X ]Y=E[X]Z=XE[X]

Y,Z=E[E[X](XE[X])]=E[X]2E[X]2=0

Una delle gambe del triangolo è , l'altra gamba è , e l'ipotenusa è . E il teorema di Pitagora può essere applicato perché una variabile casuale sminuita è ortogonale alla sua media.E [ X ] XXE[X]E[X]X


Osservazione tecnica:

Y = E [ X ] 1 E [Y in questo esempio dovrebbe davvero essere il vettore , ovvero lo scalare volte il vettore costante (ad esempio nel caso esito discreto e finito). è la proiezione vettoriale di sul vettore costante .Y=E[X]11 1 = [ 1 , 1 , 1 , , 1 ] Y X 1E[X]11=[1,1,1,,1]YX1

Esempio semplice

Considera il caso in cui è una variabile casuale di Bernoulli dove . Abbiamo:p = .2Xp=.2

X=[10]P=[.2.8]E[X]=iPiXi=.2

Y=E[X]1=[.2.2]Z=XE[X]=[.8.2]

E l'immagine è: inserisci qui la descrizione dell'immagine

La grandezza quadrata del vettore rosso è la varianza di , la grandezza quadrata del vettore blu è , e la grandezza quadrata del vettore giallo è .E [ X ] 2 E [ X 2 ]XE[X]2E[X2]

RICORDA però che queste magnitudini, l'ortogonalità ecc ... non sono rispetto al solito punto prodotto ma al prodotto interno . La grandezza del vettore giallo non è 1, è .2.Σ i P i Y i Z iiYiZiiPiYiZi

Il vettore rosso e il vettore blu sono perpendicolari sotto il prodotto interno ma non sono perpendicolari nell'intro, senso della geometria del liceo. Ricorda che non stiamo usando il solito punto prodotto come prodotto interno!Z = X - E [ X ] i P i Y i Z i i Y i Z iY=E[X]Z=XE[X]iPiYiZiiYiZi


Questo è davvero buono!
Antoni Parellada,

1
Buona risposta (+1), ma manca di una cifra, e potrebbe anche essere un po 'di confusione per OP perché la tua Z è la loro X ...
ameba dice Reinstate Monica

@MatthewGunn, ottima risposta. puoi controllare la mia risposta qui sotto per una rappresentazione in cui l'ortogonalità è nel senso euclideo.
YBE

Odio essere ottuso, ma ho problemi a mantenere , e la direzione della logica dritti ("perché" arriva in posti che non hanno senso per me). Sembra che molti fatti (ben documentati) siano dichiarati casualmente. In quale spazio si trova il prodotto interno? Perchè 1 ? V a r ( X )ZVar(X)
Mitch

@Mitch L'ordine logico è: (1) Osserva che uno spazio probabilità definisce uno spazio vettoriale; possiamo trattare variabili casuali come vettori. (2) Definire il prodotto interno delle variabili casuali e come . Nello spazio interno di un prodotto, i vettori e sono definiti ortogonali se il loro prodotto interno è zero. (3a) Sia una variabile casuale. (3b) Sia e . (4) Osservare che e definiti in questo modo sono ortogonali. (5) Da eZ E [ Y Z ] Y Z X Y = E [ X ] Z = X - E [ X ] Y Z Y ZYZE[YZ]YZXY=E[X]Z=XE[X]YZYZsono ortogonali, si applica il teorema di Pitagora (6) Per semplice algebra, il teorema di Pitagora è equivalente all'identità.
Matthew Gunn,

7

Proverò un approccio puramente geometrico per uno scenario molto specifico. Consideriamo una variabile casuale valutata discreta che assume valori con probabilità . Supponiamo inoltre che questa variabile casuale possa essere rappresentata in come un vettore, . { x 1 , x 2 } ( p 1 , p 2 ) R 2 X = ( x 1 X{x1,x2}(p1,p2)R2X=(x1p1,x2p2)inserisci qui la descrizione dell'immagine

Si noti che il quadrato di lunghezza di è che è uguale a . Pertanto, .x 2 1 p 1 + x 2 2 p 2 E [ X 2 ] X = Xx12p1+x22p2E[X2]X=E[X2]

Poiché , la punta del vettore traccia effettivamente un'ellisse. Questo diventa più facile da vedere se si riparametrizza e come e . Quindi, abbiamo e .p1+p2=1Xp1p2cos2(θ)sin2(θ)p1=cos(θ)p2=sin(θ)

Un modo di disegnare ellissi è tramite un meccanismo chiamato Trammel di Archimede . Come descritto nel wiki: consiste di due navette che sono confinate ("tramate") su canali o binari perpendicolari e una barra che è fissata alle navette da perni in posizioni fisse lungo la barra. Mentre le navette si muovono avanti e indietro, ciascuna lungo il suo canale, l'estremità dell'asta si muove in un percorso ellittico. Questo principio è illustrato nella figura seguente.

Ora analizziamo geometricamente un'istanza di questo tramaglio quando la navetta verticale è su e la navetta orizzontale su B formando un angolo di θ . A causa della costruzione, | B X | = x 2 e | A B | = x 1 - x 2 , θ (qui x 1x 2 è assunto wlog).ABθ|BX|=x2|AB|=x1x2θx1x2

inserisci qui la descrizione dell'immagine

Tracciamo una linea dall'origine, , che è perpendicolare all'asta. Si può dimostrare che | O C | = ( x 1 - x 2 ) sin ( θ ) cos ( θ ) . Per questa specifica variabile casuale V a r ( X )OC|OC|=(x1x2)sin(θ)cos(θ) Pertanto, la distanza perpendicolare| OC| dall'origine all'asta è effettivamente uguale alla deviazione standard,σ.

Var(X)=(x12p1+x22p2)(x1p1+x2p2)2=x12p1+x22p2x12p12x22p222x1x2p1p2=x12(p1p12)+x22(p2p22)2x1x2p1p2=p1p2(x122x1x2+x22)=[(x1x2)p1p2]2=|OC|2
|OC|σ

Se calcoliamo la lunghezza del segmento da a X : | C X |CX

|CX|=x2+(x1x2)cos2(θ)=x1cos2(θ)+x2sin2(θ)=x1p1+x2p2=E[X]

Applicando il teorema di Pitagora nel triangolo OCX, finiamo con

E[X2]=Var(X)+E[X]2.

Riassumendo , per un tram che descriva tutte le possibili variabili casuali a valore discreto che assumono valori , {x1,x2} è la distanza dall'origine alla punta del meccanismo e la deviazione standardσè la distanza perpendicolare all'asta.E[X2]σ

Nota : Notare che quando è 0 o π / 2 , X è completamente deterministico. Quando θ è π / 4 finiamo con la massima varianza.θ0π/2Xθπ/4


1
+1 bella risposta. E moltiplicare i vettori per il quadrato delle probabilità è un trucco utile / utile per rendere ortogonale la solita nozione probabilistica di ortogonalità!
Matthew Gunn,

Ottima grafica. Tutti i simboli hanno un senso (il tramaglio che descrive un'ellisse e poi il Pitagorico si applica) ma in qualche modo non sto ottenendo intuitivamente come mi dà un'idea di come 'magicamente' collega i momenti (la diffusione e il centro.
Mitch

considera il trammel come un processo che definisce tutte le possibili variabili casuali valutate. Quando l'asta è orizzontale o verticale hai un camper deterministico. Nel mezzo c'è casualità e si scopre che nella mia struttura geometrica proposta come casuale un RV (il suo std) viene misurato esattamente dalla distanza dell'asta rispetto all'origine. Potrebbe esserci una relazione più profonda qui poiché le curve ellittiche collegano vari oggetti in matematica, ma io non sono un matematico, quindi non riesco davvero a vedere quella connessione. (x1,x2)
YBE

3

È possibile riorganizzare come segue:

Var(X)=E[X2](E[X])2E[X2]=(E[X])2+Var(X)

Quindi, interpretare come segue: il quadrato atteso di una variabile casuale è uguale al quadrato della sua media più la deviazione quadrata prevista dalla sua media.


Oh. Huh. Semplice. Ma i quadrati sembrano ancora un po 'non interpretati. Voglio dire, ha senso (una specie, estremamente vagamente) senza i quadrati.
Mitch,

3
Non sono venduto su questo.
Michael R. Chernick,

1
Se si applica il teorema di Pitagora, qual è il triangolo con quali lati e come sono perpendicolari le due gambe?
Mitch

1

Scusate se non ho la capacità di elaborare e fornire una risposta adeguata, ma penso che la risposta risieda nel concetto di meccanica fisica classica dei momenti, in particolare la conversione tra momenti "grezzi" centrati su 0 e momenti centrali centrati sul significato. Tieni presente che la varianza è il momento centrale del secondo ordine di una variabile casuale.


1

L'intuizione generale è che è possibile mettere in relazione questi momenti usando il Teorema di Pitagora (PT) in uno spazio vettoriale adeguatamente definito, mostrando che due dei momenti sono perpendicolari e il terzo è l'ipotenusa. L'unica algebra necessaria è dimostrare che le due gambe sono effettivamente ortogonali.

Per il seguente motivo, supporrò che intendevi medie di esempio e variazioni per scopi di calcolo piuttosto che momenti per distribuzioni complete. Questo è:

E[X]=1nxi,mean,first central sample momentE[X2]=1nxi2,second sample moment (noncentral)Var(X)=1n(xiE[X])2,variance,second central sample moment

(dove tutte le somme sono oltre elementi).n

Per riferimento, la prova elementare di è solo un simbolo che spinge: V a r ( X )Var(X)=E[X2]E[X]2

Var(X)=1n(xiE[X])2=1n(xi22E[X]xi+E[X]2)=1nxi22nE[X]xi+1nE[X]2=E[X2]2E[X]2+1nnE[X]2=E[X2]E[X]2

C'è poco significato qui, solo manipolazione elementare dell'algebra. Si potrebbe notare che è una costante all'interno della somma, ma questo è tutto.E[X]

Ora nello spazio vettoriale / interpretazione geometrica / intuizione, ciò che mostreremo è l'equazione leggermente riorganizzata che corrisponde a PT, che

Var(X)+E[X]2=E[X2]

Quindi considera , il campione di n elementi, come un vettore in R n . E creiamo due vettori E [ X ] 1 e X - E [ X ] 1 .XnRnE[X]1XE[X]1

Il vettore ha la media del campione come ciascuna delle sue coordinate.E[X]1

Il vettore è x 1 - E [ X ] , ... , x n - E [ X ] .XE[X]1x1E[X],,xnE[X]

Questi due vettori sono perpendicolari perché il prodotto punto dei due vettori risulta essere 0:

E[X]1(XE[X]1)=E[X](xiE[X])=(E[X]xiE[X]2)=E[X]xiE[X]2=nE[X]E[X]nE[X]2=0

Quindi i due vettori sono perpendicolari, il che significa che sono le due gambe di un triangolo rettangolo.

Quindi per PT (che tiene in ), la somma dei quadrati delle lunghezze delle due gambe è uguale al quadrato dell'ipotenusa.Rn

Dalla stessa algebra usata nella noiosa dimostrazione algebrica in alto, abbiamo mostrato che otteniamo che è il quadrato del vettore ipotenuso:E[X2]

dove quadratura è il prodotto punto (ed è in realtà E [ x ] 1 e ( X - E [ X ] ) 2 è V a r ( X ) .(XE[X])2+E[X]2=...=E[X2]E[x]1(XE[X])2Var(X)

La parte interessante di questa interpretazione è la conversione da un campione di elementi da una distribuzione univariata a uno spazio vettoriale di n dimensioni. Questo è simile a n campioni bivariati interpretati come due campioni in n variabili.nnnn

In un certo senso, il triangolo rettangolo tra vettori ed come ipotenusa. Abbiamo fornito un'interpretazione (vettori) per questi valori e dimostriamo che corrispondono. È abbastanza interessante, ma non illuminante né statisticamente né geometricamente. Non direbbe davvero perché e sarebbe un sacco di macchine extra concettuali per, alla fine, per lo più riprodurre la prova puramente algebrica che avevamo già all'inizio.E[X2]

n


Sono anche interessato a un'interpretazione / intuizione dietro l'equazione di compromesso di varianza superficialmente simile. Qualcuno ha suggerimenti lì?
Mitch,

piipi=1nipiXiYi=1niXiYiE[XY]XYnipi=1nE[XY]=ipiXiYinE[XY]Pipi=1n

x^y^x^i=xipiy^i=xipix^y^=ixipiyipi=ipixiyi=E[xy]x^y^E[xy]
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.