Vorrei implementare un algoritmo per la selezione automatica del modello. Sto pensando di fare una regressione graduale, ma tutto lo farà (deve essere basato su regressioni lineari). Il mio problema è che non sono in grado di trovare una metodologia o un'implementazione open source (sto woking in java). La metodologia …
Sto iniziando a dilettarsi con l'uso di glmnetcon LASSO Regressione dove il mio risultato di interesse è dicotomica. Di seguito ho creato un piccolo frame di dati finti: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …
Recentemente ho letto molto su questo sito (@Aniko, @Dikran Marsupial, @Erik) e altrove sul problema del sovradimensionamento che si verifica con convalida incrociata - (Smialowski et al 2010 Bioinformatica, Hastie, Elementi di apprendimento statistico). Il suggerimento è che qualsiasi selezione di funzionalità supervisionata (utilizzando la correlazione con le etichette di …
Mi sto confondendo un po 'sulla selezione delle funzionalità e sull'apprendimento automatico e mi chiedevo se potevi aiutarmi. Ho un set di dati di microarray che è classificato in due gruppi e ha migliaia di funzionalità. Il mio obiettivo è quello di ottenere un piccolo numero di geni (le mie …
Ho letto Elements of Statistical Learning e vorrei sapere perché il Lazo fornisce una selezione variabile e la regressione della cresta no. Entrambi i metodi riducono al minimo la somma residua di quadrati e hanno un vincolo sui possibili valori dei parametri ββ\beta . Per il Lazo, il vincolo è …
Questa domanda è stata posta sul CV alcuni anni fa, sembra ripubblicare alla luce di 1) ordine di grandezza migliore tecnologia informatica (ad es. Calcolo parallelo, HPC ecc.) E 2) tecniche più recenti, ad es. [3]. Innanzitutto, un po 'di contesto. Supponiamo che l'obiettivo non sia il test delle ipotesi, …
Da quello che so, l'uso del lazo per la selezione delle variabili gestisce il problema degli input correlati. Inoltre, poiché equivale alla regressione del minimo angolo, non è lento dal punto di vista computazionale. Tuttavia, molte persone (ad esempio persone che conosco facendo bio-statistiche) sembrano ancora favorire la selezione di …
In quali circostanze vorresti o non vuoi ridimensionare o standardizzare una variabile prima del fitting del modello? E quali sono i vantaggi / gli svantaggi del ridimensionamento di una variabile?
sfondo Sto facendo ricerche cliniche in medicina e ho seguito numerosi corsi di statistica. Non ho mai pubblicato un articolo usando la regressione lineare / logistica e vorrei fare correttamente la selezione delle variabili. L'interpretazione è importante, quindi nessuna tecnica di apprendimento automatico sofisticata. Ho riassunto la mia comprensione della …
Sono nuovo nella selezione delle funzionalità e mi chiedevo come avresti usato PCA per eseguire la selezione delle funzionalità. PCA calcola un punteggio relativo per ciascuna variabile di input che è possibile utilizzare per filtrare le variabili di input non informative? Fondamentalmente, voglio essere in grado di ordinare le caratteristiche …
Poiché la RF è in grado di gestire la non linearità ma non può fornire coefficienti, sarebbe saggio utilizzare la foresta casuale per raccogliere le caratteristiche più importanti e quindi collegarle a un modello di regressione lineare multipla al fine di ottenere i loro coefficienti?
Considero il problema della classificazione (multiclasse) in base a serie temporali di lunghezza variabile , ovvero trovare una funzione tramite una rappresentazione globale della serie temporale da un set di funzioni selezionate di dimensione fissa indipendente da , quindi utilizzare i metodi di classificazione standard su questo set di funzionalità. …
Sto cercando di interpretare i pesi variabili dati montando un SVM lineare. (Sto usando Scikit-Learn ): from sklearn import svm svm = svm.SVC(kernel='linear') svm.fit(features, labels) svm.coef_ Non riesco a trovare nulla nella documentazione che specifichi specificamente come questi pesi vengono calcolati o interpretati. Il segno del peso ha qualcosa a …
Scusate se questa domanda si presenta un po 'di base. Sto cercando di utilizzare la selezione delle variabili LASSO per un modello di regressione lineare multipla in R. Ho 15 predittori, uno dei quali è categorico (ciò causerà un problema?). Dopo aver impostato la mia ed io uso i seguenti …
Sono uno studente di economia con una certa esperienza in econometria e R. Vorrei sapere se c'è mai una situazione in cui dovremmo includere una variabile in una regressione nonostante non sia statisticamente significativa?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.