Ritenuta ripetuta di sottoinsiemi di dati durante l'adattamento del modello al fine di quantificare le prestazioni del modello sui sottoinsiemi di dati trattenuti.
Sto cercando di comprendere la convalida incrociata per la regressione logistica ordinale. Lo scopo del gioco è convalidare il modello utilizzato in un'analisi ... Per prima cosa costruisco un set di dati giocattolo: set.seed(1) N <- 10000 # predictors x1 <- runif(N) x2 <- runif(N) x3 <- runif(N) # coeffs …
Ho impostato una ricerca in griglia per un gruppo di parametri. Sto cercando di trovare i parametri migliori per una rete neurale di Keras che fa una classificazione binaria. L'output è 1 o 0. Esistono circa 200 funzioni. Quando ho fatto una ricerca sulla griglia, ho avuto un sacco di …
Quali sono i modi per scegliere quale kernel comporterebbe una buona separazione dei dati nell'output finale dei dati dal kernel PCA (analisi dei componenti principali) e quali sono i modi per ottimizzare i parametri del kernel? I termini di Layman, se possibile, sarebbero molto apprezzati e anche i collegamenti a …
Qual è il modo migliore per dividere i dati delle serie temporali in set di treni / test / validazione, dove il set di validazione verrebbe utilizzato per l'ottimizzazione dell'iperparametro? Abbiamo 3 anni di dati sulle vendite giornaliere e il nostro piano è di utilizzare il 2015-2016 come dati di …
Per la mia ricerca attuale sto usando il metodo Lazo tramite il pacchetto glmnet in R su una variabile binomiale dipendente. In glmnet la lambda ottimale si trova attraverso la validazione incrociata e i modelli risultanti possono essere confrontati con varie misure, ad esempio errori di classificazione errata o devianza. …
Nella scelta del parametro di regolarizzazione lambda in Ridge o Lasso, il metodo consigliato è provare diversi valori di lambda, misurare l'errore nel set di convalida e infine scegliere quel valore di lambda che restituisce l'errore più basso. Non è un problema per me se la funzione f (lambda) = …
Sono uno studente di fisica che studia apprendimento automatico / scienza dei dati, quindi non intendo per questa domanda iniziare alcun conflitto :) Tuttavia, gran parte di qualsiasi programma di laurea in fisica è fare laboratori / esperimenti, il che significa molti dati elaborazione e analisi statistica. Tuttavia, noto una …
Ho un set di dati con 26 funzionalità e 31000 righe. È il set di dati di 38 soggetti. È per un sistema biometrico. Quindi voglio essere in grado di identificare i soggetti. Per avere un set di test, so che devo rimuovere alcuni valori. Allora, cosa è meglio fare …
Giocando con il Boston Housing Dataset e RandomForestRegressor(con parametri di default) in scikit-learn, ho notato qualcosa di strano: il punteggio medio di validazione incrociata è diminuito quando ho aumentato il numero di pieghe oltre 10. La mia strategia di validazione incrociata era la seguente: cv_met = ShuffleSplit(n_splits=k, test_size=1/k) scores = …
Sto cercando di fare la selezione del modello su alcuni predittori candidati usando LASSO con un risultato continuo. L'obiettivo è selezionare il modello ottimale con le migliori prestazioni di predizione, che di solito può essere eseguito mediante convalida incrociata K-fold dopo aver ottenuto un percorso di soluzione dei parametri di …
Sto lavorando a un problema di classificazione che calcola una metrica di somiglianza tra due immagini radiografiche di input. Se le immagini sono della stessa persona (etichetta di "destra"), verrà calcolata una metrica più alta; l'immissione di immagini di due persone diverse (etichetta "errata") comporterà una metrica inferiore. Ho usato …
Ho eseguito la classificazione utilizzando più classificatori per dati etichettati in 2 classi e ho utilizzato la convalida incrociata 5 volte. Per ogni piega ho calcolato tp, tn, fp e fn. Quindi ho calcolato l'accuratezza, la precisione, il richiamo e il punteggio F per ciascun test. La mia domanda è: …
Sto addestrando un processo gaussiano con un kernel ARD con molti parametri massimizzando la verosimiglianza marginale dei dati, anziché la convalida incrociata. Ho il sospetto che sia troppo adatto. Come posso provare questo sospetto in un contesto bayesiano?
Esiste un'interpretazione bayesiana, ML o MDL nota della convalida incrociata? Posso interpretare la convalida incrociata come eseguire l'aggiornamento corretto su un precedente appositamente predisposto?
Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.