Statistiche e Big Data feature-selection

1

Punta e lastra bayesiane contro metodi penalizzati

Sto leggendo le diapositive di Steven Scott sul pacchetto BSTS R (le puoi trovare qui: diapositive ). Ad un certo punto, quando si parla di includere molti regressori nel modello strutturale delle serie temporali, introduce i picchi di picco e di lastra dei coefficienti di regressione e afferma che sono …

11 r bayesian feature-selection penalized bsts

1

Come interpretare i risultati quando sia la cresta che il lazo funzionano separatamente ma producono coefficienti diversi

Sto eseguendo un modello di regressione sia con Lasso che con Ridge (per prevedere una variabile di esito discreto che varia da 0-5). Prima di eseguire il modello, utilizzo il SelectKBestmetodo di scikit-learnper ridurre il set di funzionalità da 250 a 25 . Senza una selezione iniziale delle caratteristiche, sia …

11 regression predictive-models feature-selection lasso ridge-regression

2

Perché la regressione della cresta non può fornire una migliore interpretabilità rispetto a LASSO?

Ho già un'idea dei pro e dei contro della regressione della cresta e del LASSO. Per LASSO, il termine di penalità L1 produrrà un vettore di coefficienti sparsi, che può essere visto come un metodo di selezione delle caratteristiche. Tuttavia, ci sono alcune limitazioni per LASSO. Se le funzionalità hanno …

11 feature-selection lasso regularization ridge-regression elastic-net

1

Perché la selezione delle funzionalità è importante per le attività di classificazione?

Sto imparando a selezionare le funzionalità. Vedo perché sarebbe importante e utile, per la costruzione di modelli. Ma concentriamoci sulle attività di apprendimento supervisionato (classificazione). Perché la selezione delle funzionalità è importante per le attività di classificazione? Vedo molta letteratura scritta sulla selezione delle caratteristiche e sul suo utilizzo per …

11 feature-selection accuracy regression-strategies

1

Per quale tipo di selezione delle funzioni è possibile utilizzare il test Chi square?

Qui sto chiedendo cosa fanno comunemente gli altri per usare il test chi quadrato per la selezione delle caratteristiche e il risultato nell'apprendimento supervisionato. Se capisco correttamente, testano l'indipendenza tra ogni caratteristica e il risultato e confrontano i valori p tra i test per ciascuna caratteristica? In http://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test , Il …

11 hypothesis-testing chi-squared feature-selection independence scikit-learn

6

Metodi in R o Python per eseguire la selezione di funzioni nell'apprendimento non supervisionato [chiuso]

Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Quali sono i metodi / implementazioni disponibili in R / Python per scartare / selezionare funzionalità non …

11 r feature-selection python

2

Misure di separabilità delle classi nei problemi di classificazione

Un esempio di buona misura della separabilità delle classi negli studenti discriminanti lineari è il rapporto discriminante lineare di Fisher. Esistono altre metriche utili per determinare se i set di funzionalità forniscono una buona separazione delle classi tra le variabili target? In particolare, sono interessato a trovare buoni attributi di …

11 machine-learning classification feature-selection discriminant-analysis

1

Selezione automatica delle funzioni per il rilevamento di anomalie

Qual è il modo migliore per selezionare automaticamente le funzionalità per il rilevamento delle anomalie? Io di solito tratto Anomaly Detection come un algoritmo in cui le caratteristiche sono selezionati da esperti umani: ciò che conta è l'uscita gamma (come in "ingresso anormale - uscita anormale"), quindi anche con tante …

11 feature-selection outliers

1

R / mgcv: Perché i prodotti tensor te () e ti () producono superfici diverse?

Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …

11 r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

2

Penalizzazione soft-soglia vs. lazo

Sto cercando di riassumere ciò che ho capito finora nell'analisi multivariata penalizzata con insiemi di dati ad alta dimensione, e ancora faccio fatica a ottenere una definizione corretta della penalizzazione a soglia morbida rispetto al lasso (o ).L1L1L_1 Più precisamente, ho usato la regressione PLS sparsa per analizzare la struttura …

11 multivariate-analysis lasso feature-selection genetics

3

Quali sono i vantaggi della regressione graduale?

Sto sperimentando una regressione graduale per motivi di diversità nel mio approccio al problema. Quindi, ho 2 domande: Quali sono i vantaggi della regressione graduale? Quali sono i suoi punti di forza specifici? Cosa ne pensi dell'approccio ibrido, in cui usi la regressione graduale per selezionare le funzionalità e quindi …

11 regression feature-selection stepwise-regression

1

Ha senso utilizzare la selezione delle funzionalità prima di Random Forest?

Tutto è nel titolo, ha senso usare la selezione delle caratteristiche prima di usare la foresta casuale?

11 machine-learning feature-selection random-forest

2

Utilizzo di LASSO solo per la selezione delle funzioni

Nel mio corso di apprendimento automatico, abbiamo appreso come la regressione di LASSO è molto efficace nell'esecuzione della selezione delle funzionalità, poiché utilizza la regolarizzazione .l1l1l_1 La mia domanda: le persone usano normalmente il modello LASSO solo per fare la selezione delle funzioni (e quindi procedono a scaricare quelle caratteristiche …

10 feature-selection lasso regression-strategies

3

Funzioni di posizionamento nella regressione logistica

Ho usato la regressione logistica. Ho sei funzionalità, voglio conoscere le funzionalità importanti di questo classificatore che influenzano il risultato più di altre funzionalità. Ho usato il guadagno delle informazioni, ma sembra che non dipenda dal classificatore usato. Esiste un metodo per classificare le funzionalità in base alla loro importanza …

10 logistic feature-selection ranking regression-strategies

2

Rilevazione di anomalie: quale algoritmo usare?

Contesto: sto sviluppando un sistema che analizza i dati clinici per filtrare i dati non plausibili che potrebbero essere errori di battitura. Quello che ho fatto finora: Per quantificare la plausibilità, il mio tentativo finora è stato di normalizzare i dati e quindi calcolare un valore di plausibilità per il …

10 machine-learning multivariate-analysis feature-selection algorithms outliers

Domande taggate «feature-selection»