Domande taggate «sample-size»

Questo tag è molto ambiguo. Usalo quando la domanda riguarda la dimensione del campione e NESSUNO dei seguenti sono più appropriati: [piccolo campione], [dati di grandi dimensioni], [analisi di potenza], [potenza], [sottodeterminato] o [classi sbilanciate].


1
Perché una vasta scelta di K riduce il mio punteggio di convalida incrociata?
Giocando con il Boston Housing Dataset e RandomForestRegressor(con parametri di default) in scikit-learn, ho notato qualcosa di strano: il punteggio medio di validazione incrociata è diminuito quando ho aumentato il numero di pieghe oltre 10. La mia strategia di validazione incrociata era la seguente: cv_met = ShuffleSplit(n_splits=k, test_size=1/k) scores = …





1
R / mgcv: Perché i prodotti tensor te () e ti () producono superfici diverse?
Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 


2
La ponderazione basata sulla precisione (ovvero la varianza inversa) è parte integrante della meta-analisi?
La ponderazione basata sulla precisione è fondamentale per la meta-analisi? Borenstein et al. (2009) scrivono che per rendere possibile la meta-analisi tutto ciò che è necessario è che: Gli studi riportano una stima puntuale che può essere espressa come un singolo numero. La varianza può essere calcolata per quella stima …

2
Come scegliere la formazione, la convalida incrociata e le dimensioni dei set di test per dati di piccole dimensioni di campioni?
Supponiamo che io abbia una piccola dimensione del campione, ad esempio N = 100, e due classi. Come dovrei scegliere la formazione, la validazione incrociata e le dimensioni dei set di test per l'apprendimento automatico? Vorrei scegliere intuitivamente La formazione imposta la dimensione come 50 Convalida incrociata impostare la dimensione …

2
Ha senso calcolare gli intervalli di confidenza e verificare le ipotesi quando sono disponibili dati di tutta la popolazione?
Ha senso calcolare gli intervalli di confidenza e verificare le ipotesi quando sono disponibili i dati dell'intera popolazione? A mio avviso, la risposta è no, dal momento che possiamo calcolare accuratamente i veri valori dei parametri. Ma allora, qual è la proporzione massima di dati dalla popolazione originale che ci …


1
Perché Anova () e drop1 () hanno fornito risposte diverse per i GLMM?
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.