Ritenuta ripetuta di sottoinsiemi di dati durante l'adattamento del modello al fine di quantificare le prestazioni del modello sui sottoinsiemi di dati trattenuti.
Qual è la differenza tra stratificato convalida incrociata e convalida incrociata ? Wikipedia dice: Nella convalida incrociata della piega k stratificata , le pieghe sono selezionate in modo che il valore di risposta medio sia approssimativamente uguale in tutte le pieghe. Nel caso di una classificazione dicotomica, ciò significa che …
Per me, sembra che la convalida dell'aggancio sia inutile. Cioè, dividere il set di dati originale in due parti (formazione e test) e usare il punteggio del test come misura di generalizzazione, è alquanto inutile. La convalida incrociata di K-fold sembra fornire migliori approssimazioni di generalizzazione (in quanto si allena …
Nell'apprendimento statistico, implicitamente o esplicitamente, si presume sempre che l'insieme di addestramento sia composto da tuple input / response che sono disegnati indipendentemente dalla stessa distribuzione congiunta conD={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNN(Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) e la relazione che stiamo cercando di …
Considera un buon vecchio problema di regressione con predittori e dimensione del campione . La solita saggezza è che lo stimatore OLS si sovraccaricherà e sarà generalmente sovraperformato dallo stimatore della regressione della cresta:È standard utilizzare la convalida incrociata per trovare un parametro di regolarizzazione ottimale . Qui uso un …
Trasformo tutti i miei dati o le mie pieghe (se viene applicato il CV) contemporaneamente? per esempio (allData - mean(allData)) / sd(allData) Trasformo il set di treni e il set di test separatamente? per esempio (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Oppure trasformo il set di …
A parte le considerazioni sulla potenza di calcolo, ci sono dei motivi per ritenere che aumentare il numero di pieghe nella convalida incrociata porta a una migliore selezione / convalida del modello (vale a dire che maggiore è il numero di pieghe meglio è)? Portando l'argomento all'estremo, la convalida incrociata …
Mi chiedo se qualcuno sia a conoscenza di un compendio di tecniche di convalida incrociata con una discussione sulle differenze tra loro e una guida su quando usarle. Wikipedia ha un elenco delle tecniche più comuni, ma sono curioso di sapere se ci sono altre tecniche e se ci sono …
Esistono studi empirici che giustificano l'uso dell'unica regola di errore standard a favore della parsimonia? Ovviamente dipende dal processo di generazione dei dati, ma tutto ciò che analizza un ampio corpus di set di dati sarebbe una lettura molto interessante. La "regola dell'errore standard" viene applicata quando si selezionano i …
TL, DR: sembra che, contrariamente ai consigli spesso ripetuti, convalida incrociata una tantum (LOO-CV) - cioèKKK -piega CV conKKK (il numero di pieghe) uguale aNNN (il numero di osservazioni di addestramento) - fornisce stime dell'errore di generalizzazione che sono le meno variabili per qualsiasiKKK , non la più variabile, assumendo …
In tutti i contesti che conosco la convalida incrociata, viene utilizzato esclusivamente con l'obiettivo di aumentare la precisione predittiva. È possibile estendere la logica della convalida incrociata nella stima delle relazioni imparziali tra variabili? Mentre questo articolo di Richard Berk dimostra l'uso di un campione di prova per la selezione …
Ho usato il pacchetto caret in R per costruire modelli predittivi per la classificazione e la regressione. Caret fornisce un'interfaccia unificata per mettere a punto gli iperparametri del modello mediante validazione incrociata o avvio del boot. Ad esempio, se stai costruendo un semplice modello di "vicini più vicini" per la …
Quando si utilizza la convalida incrociata per effettuare la selezione del modello (come ad esempio la regolazione dell'iperparametro) e per valutare le prestazioni del modello migliore, è necessario utilizzare la convalida incrociata nidificata . L'anello esterno serve per valutare le prestazioni del modello e l'anello interno deve selezionare il modello …
Sto cercando di capire quale metodo di convalida incrociata è il migliore per la mia situazione. I seguenti dati sono solo un esempio di come risolvere il problema (in R), ma i miei Xdati reali ( xmat) sono correlati tra loro e correlati a diversi gradi con la yvariabile ( …
Ho un set di dati per il quale ho più set di etichette binarie. Per ogni set di etichette, alleno un classificatore, valutandolo per convalida incrociata. Voglio ridurre la dimensionalità utilizzando l'analisi dei componenti principali (PCA). La mia domanda è: È possibile eseguire il PCA una volta per l'intero set …
Esistono numerosi thread in CrossValidated sull'argomento di selezione del modello e convalida incrociata. Eccone alcuni: Convalida incrociata interna vs esterna e selezione del modello La risposta principale di DikranMarsupial alla selezione e alla convalida incrociata delle funzioni Tuttavia, le risposte a questi thread sono abbastanza generiche e evidenziano principalmente i …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.