Sto leggendo questo articolo sulla differenza tra l'analisi dei componenti di principio e l'analisi discriminante multipla (analisi discriminante lineare) e sto cercando di capire perché dovresti mai usare PCA piuttosto che MDA / LDA.
La spiegazione è riassunta come segue:
parlando approssimativamente in PCA stiamo cercando di trovare gli assi con le varianze massime in cui i dati sono maggiormente diffusi (all'interno di una classe, poiché PCA tratta l'intero set di dati come una classe) e in MDA stiamo inoltre massimizzando la diffusione tra le classi.
Non vorresti sempre sia massimizzare la varianza sia massimizzare la diffusione tra le classi?