Ritenuta ripetuta di sottoinsiemi di dati durante l'adattamento del modello al fine di quantificare le prestazioni del modello sui sottoinsiemi di dati trattenuti.
Quando ho diviso i miei dati etichettati in training, validazione e set di test, ho sentito tutto dal 25/25/25 al 85/5/10. Sono sicuro che questo dipende da come userai il tuo modello e da quanto è incline a sovralimentare il tuo algoritmo di apprendimento. C'è un modo per decidere o …
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
Dati i multipli di convalida incrociata di una regressione logistica e le risultanti stime multiple di ciascun coefficiente di regressione, come si dovrebbe misurare se un predittore (o un insieme di predittori) è / sono stabili e significativi in base ai coefficienti di regressione ? È diverso per la regressione …
Ho un set di dati con circa 70 variabili che vorrei ridurre. Quello che sto cercando di fare è usare CV per trovare le variabili più utili nel modo seguente. 1) Seleziona in modo casuale diciamo 20 variabili. 2) Utilizzare stepwise/ LASSO/ lars/ etc per scegliere le variabili più importanti. …
La funzione R cv.glm (libreria: avvio) calcola l'errore di stima della convalida incrociata K stimato per i modelli lineari generalizzati e restituisce delta. Ha senso usare questa funzione per una regressione del lazo (libreria: glmnet) e, in tal caso, come può essere eseguita? La libreria glmnet usa una validazione incrociata …
Vedo spesso persone che parlano della convalida incrociata 5x2 come un caso speciale di convalida incrociata nidificata . Suppongo che il primo numero (qui: 5) si riferisca al numero di pieghe nell'anello interno e il secondo numero (qui: 2) si riferisca al numero di pieghe nell'anello esterno? Quindi, in che …
Sto cercando di capire se la mia comprensione della convalida incrociata nidificata è corretta, quindi ho scritto questo esempio di giocattolo per vedere se ho ragione: import operator import numpy as np from sklearn import cross_validation from sklearn import ensemble from sklearn.datasets import load_boston # set random state state = …
Sto cercando di adattare un modello a tempo discreto in R, ma non sono sicuro di come farlo. Ho letto che puoi organizzare la variabile dipendente in diverse righe, una per ogni osservazione temporale e utilizzare la glmfunzione con un collegamento logit o cloglog. In questo senso, ho tre colonne: …
Le mie domande riguardano i GAM nel pacchetto mgcv R. A causa delle dimensioni ridotte del campione, desidero determinare l'errore di previsione utilizzando la convalida incrociata senza esclusione di dati. È ragionevole? Esiste un pacchetto o un codice come posso farlo? La errorest()funzione nel pacchetto ipred non funziona. Un semplice …
Le stime di deviazione standard sono calcolate tramite: sN=1N∑Ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−√.sN=1N∑i=1N(xi−x¯)2. s_N = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}. ( http://en.wikipedia.org/wiki/Standard_deviation#Sample_standard_deviation ) per la precisione delle previsioni campionata da 10 volte la convalida incrociata? Sono preoccupato che l'accuratezza della previsione calcolata tra ciascuna piega dipenda dalla sostanziale sovrapposizione tra le serie di allenamento …
Nella maggior parte dei casi, trattiamo solo una variabile risultato / risposta come . Tuttavia, in alcuni scenari, in particolare nei dati clinici, le variabili di risultato possono essere ad alta dimensione / multivariate. Come , dove contiene , e e questi risultati sono tutti correlati. Se rappresenta il trattamento …
Quando si esegue una validazione incrociata di 5 volte (ad esempio), è tipico calcolare una curva ROC separata per ciascuna delle 5 pieghe e spesso per una curva ROC media con std. dev. mostrato come spessore della curva. Tuttavia, per la validazione incrociata LOO, dove esiste un solo punto dati …
Sto implementando la validazione incrociata e il calcolo delle metriche di errore come RMSE, , MAE, MSE, ecc.R2R2R^2 RMSE e MAE possono avere lo stesso valore?
Nel Deep Learning di Poison di François Chollet si dice: Di conseguenza, l'ottimizzazione della configurazione del modello in base alle prestazioni sul set di convalida può comportare rapidamente un overfitting al set di convalida, anche se il modello non viene mai addestrato direttamente su di esso. Al centro di questo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.