Recentemente ho usato il bootstrap per stimare gli intervalli di confidenza per un progetto. Qualcuno che non conosce molto sulle statistiche recentemente mi ha chiesto di spiegare perché il bootstrap funziona, ovvero perché il ricampionamento dello stesso campione più e più volte dà buoni risultati. Mi sono reso conto che, …
Qui @gung fa riferimento alla regola .632+. Una rapida ricerca su Google non fornisce una risposta di facile comprensione su cosa significhi questa regola e per quale scopo venga utilizzata. Qualcuno potrebbe chiarire la regola .632+?
Vorrei che i tuoi pensieri sulle differenze tra validazione incrociata e bootstrap per stimare l'errore di previsione. Uno funziona meglio per set di dati di piccole dimensioni o set di dati di grandi dimensioni?
Supponiamo di avere una serie di dati di esempio da una distribuzione sconosciuta o complessa e di voler fare qualche deduzione su una statistica dei dati. La mia inclinazione predefinito è quello di generare solo un mucchio di campioni di bootstrap con sostituzione, e calcolare la mia statistica su ciascun …
Sto iniziando a dilettarsi con l'uso di glmnetcon LASSO Regressione dove il mio risultato di interesse è dicotomica. Di seguito ho creato un piccolo frame di dati finti: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) …
Sto cercando di comprendere la differenza tra i diversi metodi di ricampionamento (simulazione Monte Carlo, bootstrap parametrico, bootstrap non parametrico, jackknifing, cross-validation, test di randomizzazione e test di permutazione) e la loro implementazione nel mio contesto usando R. Supponiamo che io abbia la seguente situazione: voglio eseguire ANOVA con una …
Questa domanda è stata innescata da qualcosa che ho letto in questo manuale di statistica a livello di laurea e anche (indipendentemente) sentito durante questa presentazione in un seminario statistico. In entrambi i casi, l'affermazione era sulla falsariga di "poiché la dimensione del campione è piuttosto piccola, abbiamo deciso di …
Apprezzo l'utilità del bootstrap per ottenere stime di incertezza, ma una cosa che mi ha sempre infastidito è che la distribuzione corrispondente a tali stime è la distribuzione definita dal campione. In generale, sembra una cattiva idea credere che le nostre frequenze di campionamento assomiglino esattamente alla distribuzione sottostante, quindi …
Entrambi i metodi bootstrap e jackknife possono essere usati per stimare il bias e l'errore standard di una stima e i meccanismi di entrambi i metodi di ricampionamento non sono molto diversi: campionare con la sostituzione vs. tralasciare un'osservazione alla volta. Tuttavia, jackknife non è così popolare come bootstrap nella …
Mi chiedo se fa differenza nell'interpretazione se solo le variabili dipendenti, dipendenti e indipendenti, o solo le variabili indipendenti, vengono trasformate in log. Considera il caso di log(DV) = Intercept + B1*IV + Error Posso interpretare il IV come l'aumento percentuale, ma come cambia quando lo faccio log(DV) = Intercept …
Ok, questa è una domanda che mi tiene sveglio la notte. La procedura bootstrap può essere interpretata come approssimativa di una procedura bayesiana (ad eccezione del bootstrap bayesiano)? Mi piace molto l '"interpretazione" bayesiana delle statistiche che trovo ben coerente e di facile comprensione. Tuttavia, ho anche un punto debole …
Ho eseguito attraverso l'affermazione che ogni campione bootstrap (o albero insaccato) conterranno in media di circa 2/32/32/3 delle osservazioni. Capisco che la possibilità di non essere scelto in una qualsiasi delle nnn trae dal nnn campioni con sostituzione è (1−1/n)n(1−1/n)n(1- 1/n)^n , che funziona a circa 1/31/31/3 possibilità di non …
Sono interessato a determinare il numero di modelli significativi che emergono da un'analisi della componente principale (PCA) o dell'analisi della funzione ortogonale empirica (EOF). Sono particolarmente interessato ad applicare questo metodo ai dati climatici. Il campo dati è una matrice MxN con M come dimensione temporale (ad esempio giorni) e …
Mi chiedo se qualcuno conosce qualche regola empirica generale relativa al numero di campioni bootstrap che uno dovrebbe usare, in base alle caratteristiche dei dati (numero di osservazioni, ecc.) E / o alle variabili incluse?
Ho esaminato numerose domande su questo sito per quanto riguarda il bootstrap e gli intervalli di confidenza, ma sono ancora confuso. Parte del motivo della mia confusione è probabilmente che non sono abbastanza avanzato nelle mie conoscenze statistiche per capire molte delle risposte. Sono a metà del corso di statistica …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.