Ho un set di dati con principalmente variabili finanziarie (120 caratteristiche, esempi 4k) che sono per lo più altamente correlate e molto rumorose (indicatori tecnici, ad esempio), quindi vorrei selezionare circa 20-30 max per un uso successivo con la formazione dei modelli (classificazione binaria - aumento diminuzione). Stavo pensando di …
Quindi, sono un principiante nel campo ML e provo a fare un po 'di classificazione. Il mio obiettivo è prevedere il risultato di un evento sportivo. Ho raccolto alcuni dati storici e ora provo a formare un classificatore. Ho ottenuto circa 1200 campioni, 0,2 dei quali li ho suddivisi a …
Ho creato alcune reti neurali (MLP (completamente connesse), Elman (ricorrenti)) per diversi compiti, come giocare a Pong, classificare cifre scritte a mano e cose ... Inoltre ho cercato di costruire alcune prime reti neurali convoluzionali, ad esempio per classificare note scritte a mano a più cifre, ma sono completamente nuovo …
Sto lavorando alla misura di importanza della funzione Gini per la foresta casuale. Pertanto, devo calcolare la diminuzione di Gini nell'impurità del nodo. Ecco il modo in cui lo faccio, che porta a un conflitto con la definizione, suggerendo che devo sbagliarmi da qualche parte ... :) Per un albero …
Mi chiedevo, perché i metodi di selezione dei modelli LASSO e LARS sono così popolari anche se sostanzialmente sono solo variazioni della selezione diretta (e quindi soffrono di dipendenza dal percorso)? Allo stesso modo, perché i metodi General to Specific (GETS) per la selezione dei modelli sono per lo più …
Cosa ne pensi dell'applicazione di tecniche di apprendimento automatico, come le foreste casuali o la regressione penalizzata (con penalità L1 o L2, o una loro combinazione) in piccoli studi clinici di esempio quando l'obiettivo è isolare predittori interessanti in un contesto di classificazione? Non è una domanda sulla selezione del …
Sono un ingegnere del software che lavora sull'apprendimento automatico. Secondo la mia comprensione, la regressione lineare (come OLS) e la classificazione lineare (come regressione logistica e SVM) fanno una previsione basata su un prodotto interno tra coefficienti addestrati e variabili caratteristica → x :w⃗ w→\vec{w}X⃗ X→\vec{x} y^= f( w⃗ ⋅ …
Quindi ho giocato con gli SVM e mi chiedo se questa è una buona cosa da fare: Ho un set di funzionalità continue (da 0 a 1) e un set di funzionalità categoriche che ho convertito in variabili fittizie. In questo caso particolare, codifico la data della misurazione in una …
So che per ogni coppia di feature class, il valore della statistica chi-quadro è calcolato quadro e confrontato con una soglia. Sono un po 'confuso però. Se ci sono funzioni e kmmmKKk classi , come si costruisce la tabella di contingenza? Come si può decidere quali funzioni conservare e quali …
Sto analizzando un set di dati usando un modello di effetti misti con un effetto fisso (condizione) e due effetti casuali (partecipante a causa del disegno e della coppia all'interno del soggetto). Il modello è stato generato conlme4 pacchetto: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Successivamente, ho eseguito un test del rapporto di verosimiglianza di …
Sto eseguendo l'analisi dei dati esplorativi (EDA) su un set di dati. Quindi selezionerò alcune funzionalità per prevedere una variabile dipendente. La domanda è: devo fare l'EDA solo sul mio set di dati di addestramento? O dovrei unirmi ai set di dati di training e test insieme, quindi fare l'EDA …
Il confronto delle funzionalità utilizza F-regressionle stesse funzionalità correlate con l'etichetta individualmente e l'osservazione del valore ?R2R2R^2 Ho visto spesso i miei colleghi utilizzare una F regressionselezione di funzionalità nella loro pipeline di machine learning da sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Alcuni, per favore, mi dicono: perché fornisce gli stessi risultati della semplice …
Ho pensato di poter giocare con un po 'di selezione delle variabili bayesiane, seguendo un bel post sul blog e i relativi documenti. Ho scritto un programma in rjags (dove sono piuttosto un principiante ) e ho recuperato i dati sui prezzi per Exxon Mobil, insieme ad alcune cose che …
Forse è solo che sono stanco, ma ho difficoltà a capire l'algoritmo Forward Stagewise Regression. Da "Elementi di apprendimento statistico" pagina 60: La regressione forward-stagewise (FS) è ancora più limitata della regressione forward-stepwise. Inizia come una regressione in avanti, con un'intercettazione uguale a [media di] y, e predittori centrati con …
Contesto : Voglio tracciare una linea in un grafico a dispersione che non appare parametrico, quindi sto usando geom_smooth()in ggplota R. Restituisce automaticamente geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.