Domande taggate «cross-validation»

Ritenuta ripetuta di sottoinsiemi di dati durante l'adattamento del modello al fine di quantificare le prestazioni del modello sui sottoinsiemi di dati trattenuti.

2
Elevata varianza della convalida incrociata con esclusione
Ho letto più volte che la convalida incrociata "Leave-one-out" ha una varianza elevata a causa della grande sovrapposizione delle pieghe di allenamento. Tuttavia, non capisco perché: le prestazioni della convalida incrociata non dovrebbero essere molto stabili (bassa varianza) proprio perché i set di addestramento sono quasi identici? O sto avendo …

1
E se un'elevata precisione di convalida ma una bassa accuratezza dei test nella ricerca?
Ho una domanda specifica sulla convalida nella ricerca sull'apprendimento automatico. Come sappiamo, il regime di apprendimento automatico chiede ai ricercatori di addestrare i loro modelli sui dati di addestramento, scegliere tra i modelli candidati per set di validazione e riportare l'accuratezza sul set di test. In uno studio molto rigoroso, …


3
Come scegliere un numero ottimale di fattori latenti nella fattorizzazione a matrice non negativa?
Data una matrice Vm×nVm×n\mathbf V^{m \times n} , la fattorizzazione a matrice non negativa (NMF) trova due matrici non negative Wm×kWm×k\mathbf W^{m \times k} e Hk×nHk×n\mathbf H^{k \times n} (cioè con tutti gli elementi ≥0≥0\ge 0 ) per rappresentare la matrice decomposta come: V≈WH,V≈WH,\mathbf V \approx \mathbf W\mathbf H, WW\mathbf …

1
Quale metodo di confronto multiplo utilizzare per un modello lmer: lsmeans o glht?
Sto analizzando un set di dati usando un modello di effetti misti con un effetto fisso (condizione) e due effetti casuali (partecipante a causa del disegno e della coppia all'interno del soggetto). Il modello è stato generato conlme4 pacchetto: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Successivamente, ho eseguito un test del rapporto di verosimiglianza di …


3
Come eseguire la suddivisione dei dati e convalidare il treno?
Sto facendo la classificazione delle immagini usando l'apprendimento automatico. Supponiamo che io abbia alcuni dati di allenamento (immagini) e li dividerò in set di addestramento e validazione. E voglio anche aumentare i dati (produrre nuove immagini da quelle originali) con rotazioni casuali e iniezione di rumore. Augmentaion viene eseguito offline. …


4
Quali sono i casi studio nella ricerca sulle politiche di sanità pubblica in cui studi o modelli non attendibili / confusi / non validi sono stati utilizzati in modo improprio?
Sto redigendo una revisione della letteratura su un problema di salute pubblica in cui i dati sono confusi: Quali sono casi studio storici comuni che vengono utilizzati nell'educazione alla salute pubblica / epidemiologia in cui relazioni o inferenze non valide o confuse sono state intenzionalmente o erroneamente impiegate nella politica …





2
Modo corretto di Scikit per calibrare i classificatori con CalibratedClassifierCV
Scikit ha CalibratedClassifierCV , che ci consente di calibrare i nostri modelli su una particolare coppia X, y. Lo afferma anche chiaramentedata for fitting the classifier and for calibrating it must be disjoint. Se devono essere disgiunti, è legittimo addestrare il classificatore con quanto segue? model = CalibratedClassifierCV(my_classifier) model.fit(X_train, y_train) …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.