Ritenuta ripetuta di sottoinsiemi di dati durante l'adattamento del modello al fine di quantificare le prestazioni del modello sui sottoinsiemi di dati trattenuti.
Sto eseguendo la preelaborazione dei dati e dopo costruirò un convoglio sui miei dati. La mia domanda è: supponiamo di avere un set di dati totale con 100 immagini, stavo calcolando la media per ciascuna delle 100 immagini e quindi sottratto da ciascuna delle immagini, quindi diviso in treno e …
Ho una regressione casuale della foresta creata usando skl e noto che produco risultati diversi in base all'impostazione del seme casuale su valori diversi. Se uso LOOCV per stabilire quale seme funziona meglio, è un metodo valido?
Mentre leggo il sito, la maggior parte delle risposte suggerisce che la validazione incrociata dovrebbe essere fatta negli algoritmi di machine learning. Tuttavia, mentre stavo leggendo il libro "Capire l'apprendimento automatico", ho visto che esiste un esercizio che a volte è meglio non usare la convalida incrociata. Sono veramente confuso. …
Sto tentando di utilizzare la regressione RF per fare previsioni sulle prestazioni di una cartiera. Ho dati minuto per minuto per gli input (velocità e quantità di pasta di legno in entrata ecc.), Nonché per le prestazioni della macchina (carta prodotta, potenza assorbita dalla macchina) e sto cercando di fare …
Mi chiedo come affrontare l'addestramento corretto e testare un modello LASSO usando glmnet in R? In particolare, mi chiedo come farlo se la mancanza di un set di dati di test esterno richiede l'uso della convalida incrociata (o altro approccio simile) per testare il mio modello LASSO. Vorrei analizzare il …
Sono consapevole del fatto che la stima della convalida incrociata k-fold dell'errore del test di solito sottovaluta l'errore effettivo del test. Sono confuso perché questo è il caso. Capisco perché l'errore di addestramento è generalmente inferiore all'errore di test - perché stai allenando il modello sugli stessi dati su cui …
Di recente ho iniziato a utilizzare Pareto per semplificare l'importanza del campionamento con convalida incrociata (PSIS-LOO), descritto in questi documenti: Vehtari, A., & Gelman, A. (2015). Pareto ha livellato il campionamento di importanza. prestampa arXiv ( collegamento ). Vehtari, A., Gelman, A., e Gabry, J. (2016). Pratica valutazione del modello …
Ho alcuni dati che esistono su un grafico . I vertici appartengono a una delle due classi e sono interessato a formare un SVM per distinguere tra le due classi. Un kernel appropriato per questo è il kernel di diffusione , dove è il Laplaciano di e è un parametro …
Per quanto ho visto, le opinioni tendono a differire su questo. Le migliori pratiche detterebbero certamente l'uso della convalida incrociata (soprattutto se si confrontano RF con altri algoritmi sullo stesso set di dati). D'altra parte, la fonte originale afferma che il fatto che l'errore OOB viene calcolato durante l'addestramento del …
Supponiamo che io abbia una piccola dimensione del campione, ad esempio N = 100, e due classi. Come dovrei scegliere la formazione, la validazione incrociata e le dimensioni dei set di test per l'apprendimento automatico? Vorrei scegliere intuitivamente La formazione imposta la dimensione come 50 Convalida incrociata impostare la dimensione …
Ho ripensato una risposta che ho dato a una domanda un paio di settimane fa La convalida incrociata hold-out produce un singolo set di test che può essere utilizzato ripetutamente per la dimostrazione. Sembriamo tutti d'accordo sul fatto che questo è in molti modi una caratteristica negativa, dal momento che …
Ho ottenuto tre modelli ridotti da un modello completo originale usando selezione in avanti eliminazione all'indietro Tecnica di penalizzazione L1 (LASSO) Per i modelli ottenuti utilizzando la selezione in avanti / eliminazione all'indietro, ho ottenuto la stima convalidata incrociata dell'errore di predizione utilizzando CVlmnel pacchetto DAAGdisponibile in R. Per il …
La selezione delle funzioni deve essere eseguita solo sui dati di allenamento (o su tutti i dati)? Ho esaminato alcune discussioni e articoli come Guyon (2003) e Singhi e Liu (2006) , ma non sono ancora sicuro della risposta giusta. La configurazione del mio esperimento è la seguente: Set di …
Supponi di avere due metodi di apprendimento per un problema di classificazione , e , e di stimare le loro prestazioni di generalizzazione con qualcosa come ripetute convalide incrociate o bootstrap. Da questo processo ottengo una distribuzione dei punteggi e per ciascun metodo attraverso queste ripetizioni (ad esempio la distribuzione …
Sto lavorando su un set di dati. Dopo aver usato alcune tecniche di identificazione del modello, sono uscito con un modello ARIMA (0,2,1). Ho usato la detectIOfunzione nel pacchetto TSAin R per rilevare un valore anomalo innovativo (IO) alla 48a osservazione del mio set di dati originale. Come posso incorporare …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.