Esistono diverse tecniche di ricampionamento popolari, che vengono spesso utilizzate nella pratica, come bootstrap, test di permutazione, coltello a serramanico, ecc. Ci sono numerosi articoli e libri che discutono di queste tecniche, ad esempio Philip I Good (2010) Test di permutazione, parametri e Bootstrap di ipotesi La mia domanda è: …
Questa domanda potrebbe essere troppo aperta per ottenere una risposta definitiva, ma speriamo di no. Gli algoritmi di apprendimento automatico, come SVM, GBM, Random Forest ecc., Generalmente hanno alcuni parametri gratuiti che, al di là di una guida empirica, devono essere adattati a ciascun set di dati. Questo viene generalmente …
Ho letto in alcune fonti, tra cui questa , che le foreste casuali non sono sensibili ai valori anomali (come lo sono la regressione logistica e altri metodi ML). Tuttavia, due pezzi di intuizione mi dicono diversamente: Ogni volta che viene costruito un albero decisionale, tutti i punti devono essere …
So che questo è un argomento piuttosto caldo in cui nessuno può davvero dare una risposta semplice. Tuttavia mi chiedo se il seguente approccio non possa essere utile. Il metodo bootstrap è utile solo se il tuo campione segue più o meno (leggi esattamente) la stessa distribuzione della popolazione originale. …
Di recente ho imparato a utilizzare le tecniche di bootstrap per calcolare errori standard e intervalli di confidenza per gli stimatori. Quello che ho imparato è che se i dati sono IID, puoi trattare i dati del campione come popolazione e fare il campionamento con la sostituzione e questo ti …
Nelle note del MIT OpenCourseWare per la 18.05 Introduzione a Probabilità e statistiche, primavera 2014 (attualmente disponibile qui ), si afferma: Il metodo percentile bootstrap è attraente per la sua semplicità. Tuttavia dipende dalla distribuzione bootstrap di base al fatto che un particolare campione rappresenta una buona approssimazione alla vera …
Si afferma spesso che il bootstrap può fornire una stima della distorsione in uno stimatore. Se t è la stima per qualche statistica, e ~ t i sono le repliche bootstrap (con i ∈ { 1 , ⋯ , N } ), allora la stima bootstrap di polarizzazione è che …
Le distribuzioni molto distorte come il log-normal non determinano intervalli di confidenza bootstrap accurati. Ecco un esempio che mostra che le aree di coda sinistra e destra sono lontane dall'ideale 0,025, indipendentemente dal metodo bootstrap che si prova in R: require(boot) n <- 25 B <- 1000 nsim <- 1000 …
Ho un manoscritto su un metodo bootstrap per testare ipotesi su un mezzo e vorrei inviarlo per la pubblicazione, ma ho un dilemma morale. Ho aderito alla protesta contro Elsevier per le loro pratiche commerciali non etiche e la lettura dell'intera questione mi ha fatto davvero mettere in discussione l'etica …
Quando si avvia un parametro per ottenere l'errore standard, si ottiene una distribuzione del parametro. Perché non utilizziamo la media di tale distribuzione come risultato o stima per il parametro che stiamo cercando di ottenere? La distribuzione non dovrebbe avvicinarsi a quella reale? Quindi avremmo una buona stima del valore …
Volevo fare una dimostrazione di classe in cui ho confrontato un intervallo t con un intervallo bootstrap e ho calcolato la probabilità di copertura di entrambi. Volevo che i dati provenissero da una distribuzione distorta, quindi ho scelto di generare i dati come exp(rnorm(10, 0, 2)) + 1, un campione …
Avendo recentemente studiato il bootstrap, mi è venuta in mente una domanda concettuale che ancora mi confonde: Hai una popolazione e vuoi conoscere un attributo della popolazione, ad esempio , dove uso per rappresentare la popolazione. Questo potrebbe essere la popolazione media per esempio. Di solito non è possibile ottenere …
È disponibile una tecnica bootstrap per calcolare gli intervalli di previsione per le previsioni dei punti ottenute ad esempio dalla regressione lineare o altro metodo di regressione (k-vicino più vicino, alberi di regressione ecc.)? In qualche modo ritengo che il modo a volte proposto di avviare semplicemente la previsione del …
Uso il pacchetto "boot" per calcolare un valore p approssimativo con avvio parziale su 2 lati ma il risultato è troppo lontano dal valore p dell'uso di t.test. Non riesco a capire cosa ho fatto di sbagliato nel mio codice R. Qualcuno può darmi un suggerimento per questo time = …
Quando uso GAM, mi dà DF residuo è (ultima riga nel codice). Cosa significa? Andando oltre l'esempio GAM, in generale, il numero di gradi di libertà può essere un numero non intero?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.