Statistiche e Big Data bootstrap

3

Test di ipotesi Bootstrap vs. permutazione

Esistono diverse tecniche di ricampionamento popolari, che vengono spesso utilizzate nella pratica, come bootstrap, test di permutazione, coltello a serramanico, ecc. Ci sono numerosi articoli e libri che discutono di queste tecniche, ad esempio Philip I Good (2010) Test di permutazione, parametri e Bootstrap di ipotesi La mia domanda è: …

37 hypothesis-testing nonparametric bootstrap permutation-test

5

Puoi esagerare con l'addestramento degli algoritmi di machine learning usando CV / Bootstrap?

Questa domanda potrebbe essere troppo aperta per ottenere una risposta definitiva, ma speriamo di no. Gli algoritmi di apprendimento automatico, come SVM, GBM, Random Forest ecc., Generalmente hanno alcuni parametri gratuiti che, al di là di una guida empirica, devono essere adattati a ciascun set di dati. Questo viene generalmente …

34 machine-learning cross-validation bootstrap optimization resampling

3

In che modo le foreste casuali non sono sensibili ai valori anomali?

Ho letto in alcune fonti, tra cui questa , che le foreste casuali non sono sensibili ai valori anomali (come lo sono la regressione logistica e altri metodi ML). Tuttavia, due pezzi di intuizione mi dicono diversamente: Ogni volta che viene costruito un albero decisionale, tutti i punti devono essere …

33 random-forest bootstrap outliers cart

2

Determinazione della dimensione del campione necessaria per il metodo bootstrap / Metodo proposto

So che questo è un argomento piuttosto caldo in cui nessuno può davvero dare una risposta semplice. Tuttavia mi chiedo se il seguente approccio non possa essere utile. Il metodo bootstrap è utile solo se il tuo campione segue più o meno (leggi esattamente) la stessa distribuzione della popolazione originale. …

33 bootstrap sample-size methodology

2

Come si esegue il bootstrap con i dati delle serie temporali?

Di recente ho imparato a utilizzare le tecniche di bootstrap per calcolare errori standard e intervalli di confidenza per gli stimatori. Quello che ho imparato è che se i dati sono IID, puoi trattare i dati del campione come popolazione e fare il campionamento con la sostituzione e questo ti …

33 time-series bootstrap

4

È vero che il bootstrap percentile non dovrebbe mai essere usato?

Nelle note del MIT OpenCourseWare per la 18.05 Introduzione a Probabilità e statistiche, primavera 2014 (attualmente disponibile qui ), si afferma: Il metodo percentile bootstrap è attraente per la sua semplicità. Tuttavia dipende dalla distribuzione bootstrap di base al fatto che un particolare campione rappresenta una buona approssimazione alla vera …

31 confidence-interval bootstrap

4

Quando è valida la stima bootstrap del bias?

Si afferma spesso che il bootstrap può fornire una stima della distorsione in uno stimatore. Se t è la stima per qualche statistica, e ~ t i sono le repliche bootstrap (con i ∈ { 1 , ⋯ , N } ), allora la stima bootstrap di polarizzazione è che …

31 bootstrap bias

2

Esiste un intervallo di confidenza non parametrico affidabile per la media di una distribuzione distorta?

Le distribuzioni molto distorte come il log-normal non determinano intervalli di confidenza bootstrap accurati. Ecco un esempio che mostra che le aree di coda sinistra e destra sono lontane dall'ideale 0,025, indipendentemente dal metodo bootstrap che si prova in R: require(boot) n <- 25 B <- 1000 nsim <- 1000 …

30 confidence-interval nonparametric mean bootstrap median

3

Consigli per un giornale open source con peer review?

Ho un manoscritto su un metodo bootstrap per testare ipotesi su un mezzo e vorrei inviarlo per la pubblicazione, ma ho un dilemma morale. Ho aderito alla protesta contro Elsevier per le loro pratiche commerciali non etiche e la lettura dell'intera questione mi ha fatto davvero mettere in discussione l'etica …

30 hypothesis-testing bootstrap journals

3

Perché non segnalare la media di una distribuzione bootstrap?

Quando si avvia un parametro per ottenere l'errore standard, si ottiene una distribuzione del parametro. Perché non utilizziamo la media di tale distribuzione come risultato o stima per il parametro che stiamo cercando di ottenere? La distribuzione non dovrebbe avvicinarsi a quella reale? Quindi avremmo una buona stima del valore …

30 distributions bootstrap standard-error expected-value

5

Perché il mio intervallo di bootstrap ha una copertura terribile?

Volevo fare una dimostrazione di classe in cui ho confrontato un intervallo t con un intervallo bootstrap e ho calcolato la probabilità di copertura di entrambi. Volevo che i dati provenissero da una distribuzione distorta, quindi ho scelto di generare i dati come exp(rnorm(10, 0, 2)) + 1, un campione …

29 bootstrap diagnostic

2

In che misura il bootstrap si avvicina alla distribuzione campionaria di uno stimatore?

Avendo recentemente studiato il bootstrap, mi è venuta in mente una domanda concettuale che ancora mi confonde: Hai una popolazione e vuoi conoscere un attributo della popolazione, ad esempio , dove uso per rappresentare la popolazione. Questo potrebbe essere la popolazione media per esempio. Di solito non è possibile ottenere …

29 bootstrap simulation resampling

1

Intervallo di previsione Bootstrap

È disponibile una tecnica bootstrap per calcolare gli intervalli di previsione per le previsioni dei punti ottenute ad esempio dalla regressione lineare o altro metodo di regressione (k-vicino più vicino, alberi di regressione ecc.)? In qualche modo ritengo che il modo a volte proposto di avviare semplicemente la previsione del …

29 bootstrap prediction-interval

3

Calcolo del valore p usando bootstrap con R

Uso il pacchetto "boot" per calcolare un valore p approssimativo con avvio parziale su 2 lati ma il risultato è troppo lontano dal valore p dell'uso di t.test. Non riesco a capire cosa ho fatto di sbagliato nel mio codice R. Qualcuno può darmi un suggerimento per questo time = …

28 r hypothesis-testing p-value bootstrap permutation-test

1

I gradi di libertà possono essere un numero non intero?

Quando uso GAM, mi dà DF residuo è (ultima riga nel codice). Cosa significa? Andando oltre l'esempio GAM, in generale, il numero di gradi di libertà può essere un numero non intero?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …

27 r degrees-of-freedom gam machine-learning pca lasso probability self-study bootstrap expected-value regression machine-learning linear-model probability simulation random-generation machine-learning distributions svm libsvm classification pca multivariate-analysis feature-selection archaeology r regression dataset simulation r regression time-series forecasting predictive-models r mean sem lavaan machine-learning regularization regression conv-neural-network convolution classification deep-learning conv-neural-network regression categorical-data econometrics r confirmatory-factor scale-invariance self-study unbiased-estimator mse regression residuals sampling random-variable sample probability random-variable convergence r survival weibull references autocorrelation hypothesis-testing distributions correlation regression statistical-significance regression-coefficients univariate categorical-data chi-squared regression machine-learning multiple-regression categorical-data linear-model pca factor-analysis factor-rotation classification scikit-learn logistic p-value regression panel-data multilevel-analysis variance bootstrap bias probability r distributions interquartile time-series hypothesis-testing normal-distribution normality-assumption kurtosis arima panel-data stata clustered-standard-errors machine-learning optimization lasso multivariate-analysis ancova machine-learning cross-validation

Domande taggate «bootstrap»