Derivazione della matrice di dispersione totale (all'interno della classe + tra le classi)


14

Stavo armeggiando con i metodi PCA e LDA e sono bloccato a un certo punto, ho la sensazione che sia così semplice che non riesco a vederlo.

Le matrici di dispersione all'interno della classe ( ) e tra le classi ( ) sono definite come:S BSWSB

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

La matrice di dispersione totale è indicata come:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

dove C è il numero di classi e N è il numero di campioni sono campioni, è la sua media di classe,μ i μxμiμ è la media generale.

Durante il tentativo di derivareST sono arrivato al punto in cui avevo:

(xμi)(μiμ)T+(μiμ)(xμi)T

come termine. Questo deve essere zero, ma perché?


Infatti:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
La risposta è che stai sommando le deviazioni dei valori attorno alla loro media e che la somma è zero. Ma cosa sono precisamente , m e m i ? In che modo m e m i sono correlati a μ e μ i ? La qualità delle risposte dipenderà da quanto accuratamente indovineremo, ma ci stai costringendo a fare un sacco di ipotesi! xmmimmiμμi
whuber

@whuber: hai perfettamente ragione, ho rivisto la mia domanda.
nimcap,

Risposte:


8

Se si assume

1Nt=1Nxti=μi

Poi

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

e la formula vale. Ti occupi del secondo mandato nello stesso modo.


2
(+1) Il secondo termine, essendo la trasposizione del primo, deve anche essere zero :-).
whuber

@whuber, sì, anche quello :)
mpiktas

Ciao, non capisco perché il presupposto sia valido? Qualcuno può spiegarlo?
Mvkt

1
μiμiiμi
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.