Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Sto usando il cursore per eseguire una foresta casuale convalidata in modo incrociato su un set di …
Preferisco di gran lunga il caret per la sua capacità di regolazione dei parametri e l'interfaccia uniforme, ma ho osservato che richiede sempre set di dati completi (cioè senza NA) anche se il modello "nudo" applicato consente le NA. Ciò è molto fastidioso, in quanto si dovrebbero applicare metodi di …
Ciò è simile ai metodi di ricampionamento di Caret , sebbene in realtà non abbia mai risposto a questa parte della domanda in modo concordato. la funzione di treno del guardiano offre cve repeatedcv. Qual è la differenza nel dire di fare: MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) vs …
La mia comprensione è che anche quando si seguono le corrette procedure di convalida incrociata e selezione dei modelli, si verificherà un overfitting se si cerca un modello abbastanza duramente , a meno che non si impongano restrizioni sulla complessità del modello, sul periodo. Inoltre, spesso le persone tentano di …
Mi ritrovo spesso ad allenare diversi modelli predittivi usando caretin R. Li addestrerò tutti sulle stesse pieghe di convalida incrociata, usando caret::: createFolds, quindi sceglierò il modello migliore in base all'errore di convalida incrociata. Tuttavia, la previsione mediana di diversi modelli sovraperforma spesso il miglior modello singolo su un set …
Sto usando la libreria caretin R per testare varie procedure di modellazione. L' trainControloggetto consente di specificare un metodo di ricampionamento. I metodi sono descritti nella documentazione di sezione 2.3 ed includono: boot, boot632, cv, LOOCV, LGOCV, repeatedcve oob. Sebbene alcuni di questi siano facili da dedurre, non tutti questi …
Sono interessato a utilizzare il cursore per fare inferenze su un determinato set di dati. È possibile effettuare le seguenti operazioni: produrre coefficienti di un modello di glmnet che ho addestrato al punto di inserimento. Vorrei usare glmnet a causa della selezione intrinseca delle funzionalità in quanto non credo che …
Il pacchetto Caret è una brillante libreria R per la creazione di più modelli di machine learning e ha diverse funzioni per la costruzione e la valutazione dei modelli. Per l'ottimizzazione dei parametri e l'addestramento del modello, il pacchetto caret offre "ripetuto" come uno dei metodi. Come buona pratica, l'ottimizzazione …
Ho appena rivisto una lezione del corso di Machine Learning su Coursera. Nella sezione in cui il professore discute di PCA per i dati di pre-elaborazione in applicazioni di apprendimento supervisionato, afferma che il PCA deve essere eseguito solo sui dati di addestramento e quindi la mappatura viene utilizzata per …
Sto sperimentando l'algoritmo della macchina per aumentare il gradiente tramite il caretpacchetto in R. Utilizzando un piccolo set di dati di ammissione al college, ho eseguito il seguente codice: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …
CARET utilizzerà automaticamente una griglia di ottimizzazione predefinita per costruire vari modelli prima di selezionare un modello finale e quindi addestrare il modello finale sui dati di allenamento completi. Posso fornire alla mia griglia di ottimizzazione solo una combinazione di parametri. Tuttavia, anche in questo caso, CARET "seleziona" il modello …
Sono un po 'confuso: in che modo i risultati di un modello addestrato tramite il cursore possono differire dal modello nella confezione originale? Ho letto Se è necessaria la preelaborazione prima della previsione utilizzando FinalModel di RandomForest con pacchetto di inserimento? ma non uso alcuna preelaborazione qui. Ho addestrato diverse …
Sembra esserci molta confusione nel confronto tra l'uso di glmnetinside caretper cercare un lambda ottimale e l'utilizzo cv.glmnetper fare lo stesso compito. Sono state poste molte domande, ad esempio: Modello di classificazione train.glmnet vs. cv.glmnet? Qual è il modo corretto di usare glmnet con il cursore? Convalida incrociata di `glmnet` …
Ho ottenuto un modello di regressione logistica (via train) per una risposta binaria e ho ottenuto la matrice di confusione logistica tramite confusionMatrixin caret. Mi dà la matrice di confusione del modello logistico, anche se non sono sicuro di quale soglia venga utilizzata per ottenerlo. Come posso ottenere la matrice …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.