Domande taggate «stratification»

3
Comprensione della convalida incrociata stratificata
Qual è la differenza tra stratificato convalida incrociata e convalida incrociata ? Wikipedia dice: Nella convalida incrociata della piega k stratificata , le pieghe sono selezionate in modo che il valore di risposta medio sia approssimativamente uguale in tutte le pieghe. Nel caso di una classificazione dicotomica, ciò significa che …

2
Perché usare la validazione incrociata stratificata? Perché questo non danneggia i benefici correlati alla varianza?
Mi è stato detto che è utile utilizzare la validazione incrociata stratificata, specialmente quando le classi di risposta sono sbilanciate. Se uno scopo della convalida incrociata è quello di aiutare a spiegare la casualità del nostro campione di dati di allenamento originale, fare sicuramente ogni piega con la stessa distribuzione …

1
Vantaggi del campionamento stratificato vs casuale per la generazione di dati di allenamento in classificazione
Vorrei sapere se ci sono alcuni / alcuni vantaggi dell'utilizzo del campionamento stratificato anziché del campionamento casuale, quando si divide il set di dati originale in training e set di test per la classificazione. Inoltre, il campionamento stratificato introduce più distorsioni nel classificatore rispetto al campionamento casuale? L'applicazione, per la …

1
L'adattamento del modello Cox con gli strati e l'interazione strati-covariata differisce dal montaggio di due modelli Cox?
In Regressione Modeling Strategies di Harrell (seconda edizione) c'è una sezione (S. 20.1.7) che discute i modelli di Cox tra cui un'interazione tra una covariata di cui vogliamo stimare anche l'effetto principale sulla sopravvivenza (età nell'esempio seguente) e un covariata di cui non vogliamo stimare l'effetto principale (genere nell'esempio seguente). …



2
Campionamento con sostituzione in R randomForest
L'implementazione randomForest non consente il campionamento oltre il numero di osservazioni, anche quando si campiona con la sostituzione. Perchè è questo? Funziona bene: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) Cosa voglio fare: rf <- randomForest(Species ~ ., iris, …

3
Modello multilivello vs. modelli separati per ogni livello
Quali sono i vantaggi e gli svantaggi dell'esecuzione di modelli separati rispetto alla modellazione multilivello? Più in particolare, supponiamo che uno studio abbia esaminato i pazienti nidificati nelle pratiche dei medici nidificati all'interno dei paesi. Quali sono i vantaggi / gli svantaggi della gestione di modelli separati per ciascun paese …

1
Perché Anova () e drop1 () hanno fornito risposte diverse per i GLMM?
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.