Domande taggate «resampling»

Il ricampionamento sta prendendo un campione da un campione. Gli usi comuni sono jackknifing (prendendo un sottocampione, ad esempio tutti i valori tranne 1) e bootstrap (campionamento con sostituzione). Queste tecniche possono fornire una solida stima di una distribuzione campionaria quando sarebbe difficile o impossibile ricavare analiticamente.

3
Come ricampionare in R senza ripetere le permutazioni?
In R, se set.seed () e quindi utilizzo la funzione di esempio per randomizzare un elenco, posso garantire che non genererò la stessa permutazione? vale a dire ... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) { permutations <- sample(myindex) print(permutations) } Questo produce [1] 1 2 …



1
Coefficiente gini e limiti di errore
Ho una serie temporale di dati con conteggi N = 14 in ciascun punto temporale e desidero calcolare il coefficiente di Gini e un errore standard per questa stima in ogni punto temporale. Dato che ho solo N = 14 conteggi in ogni momento ho proceduto calcolando la varianza del …



2
Buon testo per il ricampionamento?
Il gruppo può raccomandare un buon testo / risorsa introduttiva alle tecniche di ricampionamento applicate? In particolare, sono interessato alle alternative ai test parametrici classici (ad es. Test t, ANOVA, ANCOVA) per confrontare gruppi quando ipotesi come la normalità sono chiaramente violate. Un tipo di problema di esempio che vorrei …

1
Quale modello di apprendimento profondo può classificare categorie che non si escludono a vicenda
Esempi: ho una frase nella descrizione del lavoro: "Ingegnere senior Java nel Regno Unito". Voglio usare un modello di apprendimento profondo per prevederlo in 2 categorie: English e IT jobs. Se uso il modello di classificazione tradizionale, posso solo prevedere 1 etichetta con la softmaxfunzione all'ultimo livello. Quindi, posso usare …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Dimensione dei campioni bootstrap
Sto imparando il bootstrap come mezzo per stimare la varianza di una statistica campione. Ho un dubbio di base. Citando da http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Quante osservazioni dovremmo ricampionare? Un buon suggerimento è la dimensione del campione originale. Come possiamo ricampionare tante osservazioni quante nel campione originale? Se ho una dimensione …

1
Sovracampionamento con variabili categoriali
Vorrei eseguire una combinazione di sovracampionamento e sottocampionamento al fine di bilanciare il mio set di dati con circa 4000 clienti suddivisi in due gruppi, in cui uno dei gruppi ha una percentuale di circa il 15%. Ho esaminato SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) e ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), ma …

1
Il ricampionamento bootstrap può essere utilizzato per calcolare un intervallo di confidenza per la varianza di un set di dati?
So che se ricampiona più volte da un set di dati e calcoli la media ogni volta, questi mezzi seguiranno una distribuzione normale (da parte del CLT). Pertanto, è possibile calcolare un intervallo di confidenza sulla media del set di dati senza fare ipotesi sulla distribuzione di probabilità del set …
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.