@kjetil b halvorsen offre una bella discussione dell'intuizione geometrica alla base della semi-definitività positiva come ordinamento parziale. Darò una visione più sporca di quella stessa intuizione. Uno che procede da quale tipo di calcoli potresti voler fare con le tue matrici di varianza.
Supponiamo di avere due variabili casuali e . Se sono scalari, allora possiamo calcolare le loro varianze come scalari e confrontarli in modo ovvio usando i numeri reali scalari e . Quindi se e , diciamo che la variabile casuale ha una varianza minore di .xyV(x)V(y)V(x)=5V(y)=15xy
D'altra parte, se ed sono variabili casuali a valori vettoriali (diciamo che sono due vettori), come mettiamo a confronto le loro varianze non è così ovvio. Supponiamo che le loro variazioni siano:
Come possiamo confrontare le varianze di questi due vettori casuali? Una cosa che potremmo fare è semplicemente confrontare le varianze dei loro rispettivi elementi. Quindi, possiamo dire che la varianza di è minore della varianza di confrontando semplicemente i numeri reali, come: exy
V(x)=[10.50.51]V(y)=[8336]
x1y1V(x1)=1<8=V(y1)V(x2)=1<6=V(y2). Così, forse potremmo dire che la varianza di è la varianza di se la varianza di ogni elemento di è la varianza dell'elemento corrispondente di . Questo sarebbe come dire se ciascuno degli elementi diagonali di è l'elemento diagonale corrispondente di .
x≤yx≤yV(x)≤V(y)V(x)≤V(y)
Questa definizione sembra ragionevole a prima vista. Inoltre, fintanto che le matrici di varianza che stiamo prendendo in considerazione sono diagonali (cioè tutte le covarianze sono 0), è lo stesso che usare la semi-definizione. Cioè, se le varianze sembrano
quindi dicendo è semi-definito positivo (cioè che ) è lo stesso che dire e . Tutto sembra buono fino a quando non introduciamo le covarianze. Considera questo esempio:
V(x)=[V(x1)00V(x2)]V(y)=[V(y1)00V(y2)]
V(y)−V(x)V(x)≤V(y)V(x1)≤V(y1)V(x2)≤V(y2)V(x)=[10.10.11]V(y)=[1001]
Ora, usando un confronto che considera solo le diagonali, dovremmo dire e, in effetti, è ancora vero che elemento per elemento . Ciò che potrebbe iniziare a darci fastidio è che se calcoliamo una somma ponderata degli elementi dei vettori, come e , allora ci nel fatto che anche se stiamo dicendo .
V(x)≤V(y)V(xk)≤V(yk)3x1+2x23y1+2y2V(3x1+2x2)>V(3y1+2y2)V(x)≤V(y)
Questo è strano, vero? Quando ed sono scalari, allora garantisce che per ogni, non casuale fisso , .xyV(x)≤V(y)aV(ax)≤V(ay)
Se, per qualsiasi motivo, siamo interessati a combinazioni lineari degli elementi delle variabili casuali come questa, allora potremmo voler rafforzare la nostra definizione di per matrici di varianza. Forse vogliamo dire se e solo se è vero che , indipendentemente dai numeri fissi e che selezioniamo. Nota, questa è una definizione più forte della definizione solo diagonali poiché se scegliamo dice e se scegliamo dice .≤V(x)≤V(y)V(a1x1+a2x2)≤V(a1y1+a2y2)a1a2a1=1,a2=0V(x1)≤V(y1)a1=0,a2=1V(x2)≤V(y2)
Questa seconda definizione, quella che dice se e solo se per ogni possibile vettore fisso , è il solito metodo per confrontare la varianza matrici basate sulla semi-definitività positiva:
Guarda l'ultima espressione e la definizione di semi-definito positivo per vedere che la definizione di per matrici di varianza è scelta esattamente per garantire che if e only if per qualsiasi scelta di , cioè quando è semi positivo -preciso.V(x)≤V(y)V(a′x)≤V(a′y)a
V(a′y)−V(a′x)=a′V(x)a−a′V(y)a=a′(V(x)−V(y))a
≤V(x)≤V(y)V(a′x)≤V(a′y)a(V(y)−V(x))
Quindi, la risposta alla tua domanda è che le persone dicono che una matrice di varianza è più piccola di una matrice di varianza se è semi-definito positivo perché sono interessati a confrontare le varianze delle combinazioni lineari degli elementi dei vettori casuali sottostanti. La definizione scelta segue ciò che ti interessa calcolare e in che modo tale definizione ti aiuta con tali calcoli.VWW−V
a
eb
, sea-b
è positiva, allora potremmo dire che al momento la rimozione di variabilitàb
fuoria
rimane una certa variabilità "reale" a sinistra ina
. Allo stesso modo è un caso di varianze multivariate (= matrici di covarianza)A
eB
. SeA-B
è definito positivo, ciò significa che laA-B
configurazione dei vettori è "reale" nello spazio euclideo: in altre parole, una volta rimossoB
daA
, quest'ultimo è ancora una variabilità praticabile.