Perché il denominatore dello stimatore della covarianza non dovrebbe essere n-2 anziché n-1?


36

Il denominatore dello stimatore di varianza (imparziale) è quanto vi sono osservazioni e viene stimato solo un parametro.n1n

V(X)=i=1n(XiX¯)2n1

Allo stesso modo, mi chiedo perché il denominatore di covarianza non dovrebbe essere quando vengono stimati due parametri?n2

Cov(X,Y)=i=1n(XiX¯)(YiY¯)n1

15
Se avete fatto questo, si avrebbe avuto due definizioni contrastanti per la varianza: uno sarebbe la prima formula e l'altro sarebbe la seconda formula applicato con . Y=X
whuber

3
Una media bi / multivariata (aspettativa) è uno, non 2 parametri.
ttnphns,

14
@ttnphns Non è vero: la media bivariata è ovviamente due parametri perché richiede due numeri reali per esprimerlo. (In effetti è un singolo parametro vettoriale , ma dire così nasconde solo il fatto che ha due componenti.) Ciò si manifesta esplicitamente nei gradi di libertà per i test t di varianza in pool, ad esempio, in cui viene sottratto , non . La cosa interessante di questa domanda è come rivela quanto sia vaga, irascibile e potenzialmente fuorviante la comune "spiegazione" che sottraggiamo da perché è stato stimato un parametro. 211n
whuber

@whuber, hai ragione. Se fosse solo (osservazioni indipendenti) ciò che conta non spenderemmo più df nei test multivariati che in quelli univariati. n
ttnphns,

3
@whuber: Direi forse che mostra che ciò che conta come "parametro" dipende dalla situazione. In questo caso la varianza viene calcolata su osservazionin e quindi ogni osservazione - o la media totale - può essere vista come un parametro, anche se è una media multivariata, come diceva ttnphns. Tuttavia, in altri casi, ad esempio quando un test considera combinazioni lineari di dimensioni, ogni dimensione di ciascuna osservazione diventa "un parametro". Hai ragione, questo è un problema difficile.
ameba dice Ripristina Monica il

Risposte:


31

Le covarianze sono variazioni.

Da allora dall'identità di polarizzazione

Cov(X,Y)=Var(X+Y2)Var(XY2),

i denominatori devono essere uguali.


20

Un caso speciale dovrebbe darti un'intuizione; pensa a quanto segue:

Cov^(X,X)=V^(X)

Sei contento che quest'ultimo sia causa della correzione di Bessel.i=1n(XiX¯)2n1

Ma sostituendo con X in ^ C o v ( X , Y ) per il primo si ottiene n i = 1 ( X i - ¯ X ) ( X i - ¯ X )YXCov^(X,Y) , quindi cosa pensi che potrebbe riempire meglio nel vuoto?i=1n(XiX¯)(XiX¯)mystery denominator


1
OK. Ma l'OP potrebbe chiedere "perché considerare cov (X, X) e cov (X, Y) come in una linea di logica? Perché stai sostituendo Y con X in cov () in modo superficiale? Forse cov (X, Y) è una situazione diversa? " Non lo hai evitato, mentre la risposta (altamente votata) dovrebbe avere, nella mia impressione :-)
ttnphns

7

Una risposta rapida e sporca ... Consideriamo prima ; se aveste avuto n osservazioni con valore atteso noto E ( X ) = 0 usereste 1var(X)n E(X)=0 per stimare la varianza.1ni=1nXi2

Poiché il valore atteso è sconosciuto, puoi trasformare le tue osservazioni in n - 1 osservazioni con valore atteso noto prendendo A i = X i - X 1 per i = 2 , , n . Otterrai una formula con un n - 1 nel denominatore, tuttavia A i non sono indipendenti e dovresti tenerne conto; alla fine troverai la solita formula.nn1Ai=XiX1i=2,,nn1Ai

Ora per la covarianza puoi usare la stessa idea: se il valore atteso di fosse ( 0 , 0 ) , avresti avuto un 1(X,Y)(0,0) nella formula. Sottraendo(X1,Y1)a tutti gli altri valori osservati, si ottengonon-1osservazioni con valore atteso noto ... e11n(X1,Y1)n1 nella formula - ancora una volta, questo introduce una certa dipendenza da tenere in considerazione.1n1

PS Il modo migliore per farlo è scegliere una base ortonormale di , ovvero n - 1 vettori c 1 , , c n - 1R n tale che(1,,1)n1c1,,cn1Rn

  • per tutti i ,jcij2=1i
  • per tutti i ,jcij=0i
  • per tutti i 1i 2 .jci1jci2j=0i1i2

È quindi possibile definire variabili A i = j c i j X j e B i = j c i j Y j . Il ( A i , B i ) valore sono indipendenti, aspettato ( 0 , 0 ) , e hanno stessa varianza / covarianza rispetto alle variabili originali.n1Ai=jcijXjBi=jcijYj(Ai,Bi)(0,0)

Il punto è che se vuoi liberarti delle aspettative sconosciute, lasci cadere una (e una sola) osservazione. Questo funziona allo stesso modo per entrambi i casi.


6

Ecco una prova che lo stimatore di covarianza del campione p-variata con denominatore è uno stimatore imparziale della matrice di covarianza:1n1

.x=(x1,...,xp)

Σ=E((xμ)(xμ))

S=1n(xix¯)(xix¯)

Per mostrare: E(S)=n1nΣ

Prova: S=1nxixix¯x¯

Il prossimo:

(1) E(xixi)=Σ+μμ

(2) E(x¯x¯)=1nΣ+μμ

Pertanto: E(S)=Σ+μμ(1nΣ+μμ)=n1nΣ

E così , con il denominatore finale1Su=nn1S , è imparziale. Gli elementi off-diagonali diSusono le tue covarianze campione individuali.1n1Su

Note aggiuntive:

  1. I n pareggi sono indipendenti. Questo è usato in (2) per calcolare la covarianza della media campionaria.

  2. I passaggi (1) e (2) utilizzano il fatto che Cov(x)=E[xx]μμ

  3. Il passaggio (2) utilizza il fatto che Cov(x¯)=1nΣ


La difficoltà di essere nel passaggio 2! :)
Elvis

@Elvis È disordinato. È necessario applicare la regola Cov (X + Y, Z) = Cov (X, Z) + Cov (Y, Z) e riconoscere che le diverse estrazioni sono indipendenti. Quindi sostanzialmente riassume la covarianza n volte e ridimensionandola di 1 / n²
statchrist

4

Immagino che un modo per costruire l'intuizione dietro l'uso di 'n-1' e non 'n-2' sia che per calcolare la varianza non abbiamo bisogno di de-significare sia X che Y, ma uno dei due, ovvero


Potresti approfondire in che modo ciò influisce sulla questione di quale denominatore utilizzare? La relazione algebrica in evidenza deriva dal fatto che i residui relativi alla somma media sono pari a zero, ma per il resto tace su quale denominatore è rilevante.
whuber

5
Sono venuto qui perché avevo la stessa domanda del PO. Penso che questa risposta arrivi al nocciolo del punto sopra indicato da @whuber: che la regola empirica è che df ~ = n - (parametri stimati) può essere "vago, irriverente e potenzialmente fuorviante". Ciò evidenzia il fatto che, sebbene sembri necessario stimare due parametri (xbar e ybar), in realtà ne stimate solo uno (xbar o ybar). Poiché il df dovrebbe essere lo stesso in entrambi i casi, deve essere il più basso dei due. Penso che sia l'intento qui.
mpettis,

1

1) Avvia .df=2n

Σi=1n(XiX¯)(YiY¯)dfX¯Y¯df=2(n1)

Σi=1n(XiX¯)(YiY¯)n

A titolo di esempio banale, consideralo

24=124=212=38=46=64=83=122=241

e ciò non include irrazionali e frazioni, ad es 24=26*26, in modo che quando moltiplichiamo due serie di numeri ed esaminiamo il loro prodotto, tutto ciò che vediamo sono i df=n-1 from one number series, as we have lost half of the original information, that is, what those two numbers were before the pair-wise grouping into one number (i.e., multiplication) was performed.

In other words, without loss of generality we can write

(XiX¯)(YiY¯)=ziz¯ for some zi and z¯,

i.e., zi=XiYiX¯YiXiY¯, and, z¯=X¯Y¯. From the z's, which then clearly have df=n1, the covariance formula becomes

Σi=1nziz¯n1=

Σi=1n[(XiX¯)(YiY¯)]n1=

1n1Σi=1n(XiX¯)(YiY¯).

Thus, the answer to the question is that the df are halved by grouping.


@whuber How on earth did I get the same thing posted twice and deleted once? What gives? Can we get rid of one of them? For future reference, is there any way to permanently delete such duplicates? I have a few hanging around and it's annoying.
Carl

As far as I can tell, you reposted your answer from the duplicate to here. (Nobody else has the power to post answers in your name.) The system strongly discourages posting identical answers in multiple threads, so when I saw that, it convinced me these two threads are perfect duplicates and I "merged" them. This is a procedure that moves all comments and answers from the source thread to the target thread. I then deleted your duplicate post here in the target thread. It will remain permanently deleted, but will be visible to you as well as to people of sufficiently high reputation.
whuber

@whuber I didn't know what happens in a merge, that a merge was taking place or what many of the rules are, despite looking things up constantly. It takes time to learn, be patient, BTW, would you consider taking stats.stackexchange.com/questions/251700/… off of Hold?
Carl
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.