È possibile che l'esempio bootstrap sia esattamente uguale all'esempio originale


9

Voglio solo controllare alcuni ragionamenti.

Se il mio campione originale è di dimensione e lo avvio, allora il mio processo di pensiero è il seguente:n

è la possibilità di eventuali osservazioni tratte dal campione originale. Per garantire che il prossimo sorteggio non sia l'osservazione precedentemente campionata, limitiamo la dimensione del campione an-1. Quindi, otteniamo questo modello:1nn-1

1n1n-11n-21n-(n-1)=1n!.

È corretto? Mi imbatto nel perché non può essere invece.(1n)n


1
Non sono sicuro di seguirti. Perché vuoi "assicurarti che il prossimo sorteggio non sia il campione precedente"? Nel bootstrap, l'idea è di campionare con la sostituzione. Cioè, si fare vuoi che sia possibile che la prossima estrazione è la stessa di quella che hai già disegnato.
gung - Ripristina Monica

ma questo non significa che l'esempio bootstrap non è lo stesso dell'esempio originale?
Jayant.M,

Non ti seguo Non vuoi necessariamente che il bootcampo sia identico al tuo campione, vuoi solo trattare il campione come un modello della popolazione.
gung - Ripristina Monica

1
Quindi la mia domanda è qual è la possibilità che l'esempio bootstrap sia uguale all'esempio originale. Mi interessa che il bootstrap sia identico al campione
Jayant.M,

Scusa se la mia domanda non era chiara!
Jayant.M,

Risposte:


17

Si noti che in ogni posizione di osservazione ( ) siamo in grado di scegliere una qualsiasi delle n osservazioni, quindi non ci sono n n possibili ricampiona (mantenere l'ordine in cui vengono disegnati) di cui n ! sono lo "stesso campione" (ovvero contengono tutte le n osservazioni originali senza ripetizioni; ciò spiega tutti i modi di ordinare il campione con cui abbiamo iniziato).io=1,2,...,nnnnn!n

Ad esempio, con tre osservazioni, a, bec, hai 27 possibili campioni:

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc 

Sei di questi ne contengono uno ciascuno di a, bec.

Quindi è la probabilità di recuperare il campione originale.n!/nn

A parte - una rapida approssimazione della probabilità:

Considera che :

2π nn+12e-nn!e nn+12e-n

così

2π n12e-nn!/nne n12e-n

Con il limite inferiore quello normale indicato per l'approssimazione di Stirling (che presenta un errore relativo basso per grande ).n

[Gosper ha suggerito di usare che produrrebbe l'approssimazionen!(2n+13)πnne-n per questa probabilità, che funziona ragionevolmente bene fino a n = 3 o addirittura fino a n = 1 a seconda di quanto rigorosi siano i tuoi criteri.](2n+13)πe-nn=3n=1


(1-1n)nne-1

Per i dettagli vedere
Perché in media ogni campione bootstrap contiene circa due terzi delle osservazioni?


un',B,cun'

1
Questo è già trattato in altre risposte sul sito, ma l'ho aggiunto sopra (brevemente).
Glen_b

1
(1n)n

1
n!

1
n=1n=3n=2n=1
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.