Domande taggate «pca»

L'analisi dei componenti principali (PCA) è una tecnica di riduzione dimensionale lineare. Riduce un set di dati multivariato a un set più piccolo di variabili costruite preservando quante più informazioni (più varianza) possibile. Queste variabili, chiamate componenti principali, sono combinazioni lineari delle variabili di input.


5
In che modo i principali componenti principali possono conservare il potere predittivo su una variabile dipendente (o persino portare a previsioni migliori)?
Supponiamo che io sono in esecuzione una regressione Y∼XY∼XY \sim X . Perché selezionando i componenti principali di di , il modello mantiene il suo potere predittivo su ?kkkXXXYYY Capisco che dal punto di vista della riduzione di dimensionalità / selezione delle caratteristiche, se sono gli autovettori della matrice di …

3
Interpretazione della regolarizzazione della cresta nella regressione
Ho diverse domande riguardanti la penalità della cresta nel contesto dei minimi quadrati: βridge=(λID+X′X)−1X′yβridge=(λID+X′X)−1X′y\beta_{ridge} = (\lambda I_D + X'X)^{-1}X'y 1) L'espressione suggerisce che la matrice di covarianza di X è ridotta verso una matrice diagonale, il che significa che (supponendo che le variabili siano standardizzate prima della procedura) verrà ridotta …


2
Come utilizzare i risultati R prcomp per la previsione?
Ho un data.frame con 800 obs. di 40 variabili e vorrei utilizzare l'analisi dei componenti di principio per migliorare i risultati della mia previsione (che finora funziona meglio con Support Vector Machine su circa 15 variabili selezionate manualmente). Comprendo che un prcomp può aiutarmi a migliorare le mie previsioni, ma …
25 r  pca 

3
LSA vs. PCA (clustering di documenti)
Sto studiando varie tecniche utilizzate nel raggruppamento di documenti e vorrei chiarire alcuni dubbi riguardanti PCA (analisi dei componenti principali) e LSA (analisi semantica latente). Prima cosa: quali sono le differenze tra loro? So che in PCA, la decomposizione SVD viene applicata alla matrice termine-covarianza, mentre in LSA è la …

2
La PCA è instabile in multicollinearità?
So che in una situazione di regressione, se si dispone di un insieme di variabili altamente correlate, questo è generalmente "negativo" a causa dell'instabilità dei coefficienti stimati (la varianza va verso l'infinito mentre il determinante va verso lo zero). La mia domanda è se questa "cattiveria" persista in una situazione …

5
Esempi di PCA in cui i PC con bassa varianza sono "utili"
Normalmente nell'analisi dei componenti principali (PCA) vengono utilizzati i primi PC e i PC a bassa varianza vengono eliminati, in quanto non spiegano gran parte della variazione dei dati. Tuttavia, ci sono esempi in cui i PC a bassa variazione sono utili (ovvero hanno un uso nel contesto dei dati, …
24 pca 


3
In che modo il PCA sparso è meglio del PCA?
Ho appreso della PCA alcune lezioni fa in classe e approfondendo questo affascinante concetto, ho imparato a conoscere la PCA sparsa. Volevo chiederti, se non sbaglio, questo è ciò che è un PCA scarso: in PCA, se hai punti di dati con variabili , puoi rappresentare ogni punto di dati …

1
Proprietà del PCA per osservazioni dipendenti
Usiamo solitamente PCA come tecnica di riduzione della dimensionalità per i dati in cui si presume che i casi siano considerati Domanda: Quali sono le sfumature tipiche dell'applicazione del PCA per dati dipendenti e non iid? Quali proprietà utili / utili di PCA che detengono per i dati iid sono …

2
Qual è la differenza tra PCA e PCA asintotico?
In due articoli del 1986 e del 1988 , Connor e Korajczyk hanno proposto un approccio alla modellizzazione dei rendimenti delle attività. Dato che queste serie temporali di solito hanno più risorse rispetto alle osservazioni sul periodo, hanno proposto di eseguire un PCA sulle covarianze trasversali dei rendimenti delle attività. …
23 pca  econometrics 

4
Imputazione di valori mancanti per PCA
Ho usato la prcomp()funzione per eseguire un PCA (analisi del componente principale) in R. Tuttavia, c'è un bug in quella funzione in modo che il na.actionparametro non funzioni. Ho chiesto aiuto su stackoverflow ; due utenti hanno offerto due modi diversi di trattare i NAvalori. Tuttavia, il problema con entrambe …

1
Perché ci sono solo
Nel PCA, quando il numero di dimensioni è maggiore (o addirittura uguale a) del numero di campioni N , perché avrai al massimo N - 1 autovettori diversi da zero? In altre parole, il rango della matrice di covarianza tra le dimensioni d ≥ N è N - 1 .dddNNNN−1N−1N-1d≥Nd≥Nd\ge …

2
Perché PCA dei dati mediante SVD dei dati?
Questa domanda riguarda un modo efficiente per calcolare i componenti principali. Molti testi su PCA lineare sostengono l'uso della decomposizione a valore singolare dei dati casewise . Cioè, se abbiamo dati e vogliamo sostituire le variabili (le sue colonne ) con i componenti principali, facciamo SVD: , valori singolari (radici …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.