Si noti che in ogni posizione di osservazione ( ) siamo in grado di scegliere una qualsiasi delle n osservazioni, quindi non ci sono n n possibili ricampiona (mantenere l'ordine in cui vengono disegnati) di cui n ! sono lo "stesso campione" (ovvero contengono tutte le n osservazioni originali senza ripetizioni; ciò spiega tutti i modi di ordinare il campione con cui abbiamo iniziato).i = 1 , 2 , . . . , nnnnn !n
Ad esempio, con tre osservazioni, a, bec, hai 27 possibili campioni:
aaa aab aac aba abb abc aca acb acc
baa bab bac bba bbb bbc bca bcb bcc
caa cab cac cba cbb cbc cca ccb ccc
Sei di questi ne contengono uno ciascuno di a, bec.
Quindi è la probabilità di recuperare il campione originale.n ! / nn
A parte - una rapida approssimazione della probabilità:
Considera che :
2 π--√ nn + 12e- n≤ n ! ≤ e n n + 12e- n
così
2 π--√ n12e- n≤ n ! / nn≤ e n 12e- n
Con il limite inferiore quello normale indicato per l'approssimazione di Stirling (che presenta un errore relativo basso per grande ).n
[Gosper ha suggerito di usare che produrrebbe l'approssimazione √n ! ≈ ( 2 n + 13)π---------√nne- n per questa probabilità, che funziona ragionevolmente bene fino a n = 3 o addirittura fino a n = 1 a seconda di quanto rigorosi siano i tuoi criteri.]( 2 n + 13) π--------√e- nn = 3n = 1
( 1 - 1n)nne- 1
Per i dettagli vedere
Perché in media ogni campione bootstrap contiene circa due terzi delle osservazioni?