Domande taggate «cross-validation»

Ritenuta ripetuta di sottoinsiemi di dati durante l'adattamento del modello al fine di quantificare le prestazioni del modello sui sottoinsiemi di dati trattenuti.

2
La regolarizzazione può essere utile se siamo interessati solo alla modellazione, non alla previsione?
La regolarizzazione può essere utile se siamo interessati solo a stimare (e interpretare) i parametri del modello, non a previsioni o previsioni? Vedo come la regolarizzazione / convalida incrociata sia estremamente utile se il tuo obiettivo è fare buone previsioni su nuovi dati. Ma cosa succede se stai facendo economia …






1
Prova della formula LOOCV
Da un'introduzione all'apprendimento statistico di James et al., La stima di convalida incrociata (LOOCV) lascia una traccia è definita da dove .MSEi=(yi - y i)2CV( n )= 1nΣi = 1nMSEioCV(n)=1nΣio=1nMSEio\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEio= ( yio- y^io)2MSEio=(yio-y^io)2\text{MSE}_i = (y_i-\hat{y}_i)^2 Senza prove, l'equazione (5.2) afferma che per i minimi quadrati o la regressione …

5
Variabilità nei risultati di cv.glmnet
Sto usando cv.glmnetper trovare predittori. L'impostazione che utilizzo è la seguente: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients") choicePred<-rownames(results)[which(results !=0)] Per assicurarsi che i risultati sono riproducibili io set.seed(1). I risultati sono molto variabili. Ho eseguito esattamente lo stesso codice 100 per vedere quanto variabili fossero i risultati. Nelle corse 98/100 era sempre stato …


2
Quante volte dovremmo ripetere un CV K-fold?
Mi sono imbattuto in questo thread guardando le differenze tra bootstrap e cross validation - ottima risposta e riferimenti a proposito. Quello che mi chiedo è ora, se fossi di eseguire ripetute dire CV di 10 volte per calcolare la precisione di un classificatore, quante volte n dovrei ripeterlo? Fa …


4
Convalida incrociata e messa a punto dei parametri
Qualcuno può dirmi che cosa dà esattamente un'analisi di convalida incrociata come risultato? È solo la precisione media o fornisce qualche modello con parametri ottimizzati? Perché, ho sentito da qualche parte che la convalida incrociata viene utilizzata per l'ottimizzazione dei parametri.


2
Perché usare il ridimensionamento di Platt?
Al fine di calibrare un livello di confidenza con una probabilità nell'apprendimento supervisionato (diciamo per mappare la confidenza da un SVM o un albero decisionale usando dati sovracampionati) un metodo consiste nell'utilizzare il ridimensionamento di Platt (ad esempio, Ottenere probabilità calibrate dall'amplificazione ). Fondamentalmente si usa la regressione logistica per …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.