Statistiche e Big Data pca

1

In che modo sono correlati PCA, LDA, CCA e PLS? Sembrano tutti "spettrali" e lineari algebrici e molto ben compresi (diciamo più di 50 anni di teoria costruita attorno a loro). Sono usati per cose molto diverse (PCA per la riduzione della dimensionalità, LDA per la classificazione, PLS per la …

26 pca discriminant-analysis partial-least-squares canonical-correlation

5

In che modo i principali componenti principali possono conservare il potere predittivo su una variabile dipendente (o persino portare a previsioni migliori)?

Supponiamo che io sono in esecuzione una regressione Y∼XY∼XY \sim X . Perché selezionando i componenti principali di di , il modello mantiene il suo potere predittivo su ?kkkXXXYYY Capisco che dal punto di vista della riduzione di dimensionalità / selezione delle caratteristiche, se sono gli autovettori della matrice di …

25 regression classification pca dimensionality-reduction regularization

3

Interpretazione della regolarizzazione della cresta nella regressione

Ho diverse domande riguardanti la penalità della cresta nel contesto dei minimi quadrati: βridge=(λID+X′X)−1X′yβridge=(λID+X′X)−1X′y\beta_{ridge} = (\lambda I_D + X'X)^{-1}X'y 1) L'espressione suggerisce che la matrice di covarianza di X è ridotta verso una matrice diagonale, il che significa che (supponendo che le variabili siano standardizzate prima della procedura) verrà ridotta …

25 regression pca regularization ridge-regression

2

Ha senso combinare PCA e LDA?

Supponiamo di avere un set di dati per un'attività di classificazione statistica supervisionata, ad esempio tramite un classificatore di Bayes. Questo set di dati è composto da 20 funzionalità e desidero ridurlo a 2 funzionalità tramite tecniche di riduzione della dimensionalità come Analisi componenti principali (PCA) e / o Analisi …

25 classification pca regularization discriminant-analysis overfitting

2

Come utilizzare i risultati R prcomp per la previsione?

Ho un data.frame con 800 obs. di 40 variabili e vorrei utilizzare l'analisi dei componenti di principio per migliorare i risultati della mia previsione (che finora funziona meglio con Support Vector Machine su circa 15 variabili selezionate manualmente). Comprendo che un prcomp può aiutarmi a migliorare le mie previsioni, ma …

25 r pca

3

LSA vs. PCA (clustering di documenti)

Sto studiando varie tecniche utilizzate nel raggruppamento di documenti e vorrei chiarire alcuni dubbi riguardanti PCA (analisi dei componenti principali) e LSA (analisi semantica latente). Prima cosa: quali sono le differenze tra loro? So che in PCA, la decomposizione SVD viene applicata alla matrice termine-covarianza, mentre in LSA è la …

25 clustering pca data-mining svd lsa

2

La PCA è instabile in multicollinearità?

So che in una situazione di regressione, se si dispone di un insieme di variabili altamente correlate, questo è generalmente "negativo" a causa dell'instabilità dei coefficienti stimati (la varianza va verso l'infinito mentre il determinante va verso lo zero). La mia domanda è se questa "cattiveria" persista in una situazione …

25 pca multicollinearity

5

Esempi di PCA in cui i PC con bassa varianza sono "utili"

Normalmente nell'analisi dei componenti principali (PCA) vengono utilizzati i primi PC e i PC a bassa varianza vengono eliminati, in quanto non spiegano gran parte della variazione dei dati. Tuttavia, ci sono esempi in cui i PC a bassa variazione sono utili (ovvero hanno un uso nel contesto dei dati, …

24 pca

2

Come capire "non lineare" come in "riduzione della dimensionalità non lineare"?

Sto cercando di comprendere le differenze tra i metodi di riduzione della dimensionalità lineare (ad es. PCA) e quelli non lineari (ad es. Isomap). Non riesco proprio a capire cosa implica la (non) linearità in questo contesto. Ho letto da Wikipedia che In confronto, se PCA (un algoritmo di riduzione …

24 pca terminology dimensionality-reduction pattern-recognition manifold-learning

3

In che modo il PCA sparso è meglio del PCA?

Ho appreso della PCA alcune lezioni fa in classe e approfondendo questo affascinante concetto, ho imparato a conoscere la PCA sparsa. Volevo chiederti, se non sbaglio, questo è ciò che è un PCA scarso: in PCA, se hai punti di dati con variabili , puoi rappresentare ogni punto di dati …

24 machine-learning pca sparse

1

Proprietà del PCA per osservazioni dipendenti

Usiamo solitamente PCA come tecnica di riduzione della dimensionalità per i dati in cui si presume che i casi siano considerati Domanda: Quali sono le sfumature tipiche dell'applicazione del PCA per dati dipendenti e non iid? Quali proprietà utili / utili di PCA che detengono per i dati iid sono …

23 time-series pca non-independent iid

2

Qual è la differenza tra PCA e PCA asintotico?

In due articoli del 1986 e del 1988 , Connor e Korajczyk hanno proposto un approccio alla modellizzazione dei rendimenti delle attività. Dato che queste serie temporali di solito hanno più risorse rispetto alle osservazioni sul periodo, hanno proposto di eseguire un PCA sulle covarianze trasversali dei rendimenti delle attività. …

23 pca econometrics

4

Imputazione di valori mancanti per PCA

Ho usato la prcomp()funzione per eseguire un PCA (analisi del componente principale) in R. Tuttavia, c'è un bug in quella funzione in modo che il na.actionparametro non funzioni. Ho chiesto aiuto su stackoverflow ; due utenti hanno offerto due modi diversi di trattare i NAvalori. Tuttavia, il problema con entrambe …

23 r pca missing-data data-imputation

1

Perché ci sono solo

Nel PCA, quando il numero di dimensioni è maggiore (o addirittura uguale a) del numero di campioni N , perché avrai al massimo N - 1 autovettori diversi da zero? In altre parole, il rango della matrice di covarianza tra le dimensioni d ≥ N è N - 1 .dddNNNN−1N−1N-1d≥Nd≥Nd\ge …

22 pca dimensionality-reduction eigenvalues

2

Perché PCA dei dati mediante SVD dei dati?

Questa domanda riguarda un modo efficiente per calcolare i componenti principali. Molti testi su PCA lineare sostengono l'uso della decomposizione a valore singolare dei dati casewise . Cioè, se abbiamo dati e vogliamo sostituire le variabili (le sue colonne ) con i componenti principali, facciamo SVD: , valori singolari (radici …

22 pca algorithms svd matrix-decomposition

Domande taggate «pca»