Ho appreso della PCA alcune lezioni fa in classe e approfondendo questo affascinante concetto, ho imparato a conoscere la PCA sparsa.
Volevo chiederti, se non sbaglio, questo è ciò che è un PCA scarso: in PCA, se hai punti di dati con variabili , puoi rappresentare ogni punto di dati nello spazio dimensionale prima di applicare PCA. Dopo aver applicato il PCA, è possibile rappresentarlo nuovamente nello stesso spazio dimensionale, ma, questa volta, il primo componente principale conterrà la maggiore varianza, il secondo conterrà la seconda direzione con più varianza e così via. Quindi puoi eliminare gli ultimi componenti principali, poiché non causeranno molta perdita di dati e puoi comprimere i dati. Destra?p
PCA sparsa sta selezionando i componenti principali in modo tale che questi contengano meno valori diversi da zero nei loro coefficienti vettoriali.
In che modo ciò dovrebbe aiutarti a interpretare meglio i dati? Qualcuno può fare un esempio?