Questa domanda deriva da questa sulla "Regola .632". Sto scrivendo con particolare riferimento alla risposta / notazione di user603 nella misura in cui semplifica le cose.
Quella risposta inizia con un campione di dimensione con sostituzione, da elementi distinti nella raccolta (chiamalo) esso N. La probabilità che campione sia diverso da un elemento particolare di N è quindi
In quella risposta tutti gli elementi di N hanno le stesse probabilità di essere disegnati casualmente.
La mia domanda è questa: supponiamo invece che nella domanda precedente gli elementi da disegnare siano tali da essere normalmente distribuiti. Cioè, suddividiamo la curva normale standard da a in (diciamo) 100 sottointervalli di uguale lunghezza. Ognuno dei 100 elementi in N ha una probabilità di essere disegnato che è uguale all'area sottesa dalla curva nel suo rispettivo intervallo.
Il mio pensiero era il seguente:
Penso che il ragionamento sia simile a quello della risposta collegata. La probabilità che , con un elemento di N, sia in cui è la probabilità di disegnare
La probabilità che un particolare elemento m sia nel campione S di dimensione n è
Un calcolo sembra mostrare che man mano che la lunghezza dei sottointervalli si riduce, la risposta converge nello stesso numero del primo caso (le probabilità di tutte uguali).
Questo sembra controintuitivo (per me) perché la costruzione sembra introdurre elementi di N che sono rari, quindi mi aspetto un numero inferiore a .632.
Inoltre, se questo è corretto, immagino che avremmo
che non so essere ancora vero o falso.
Modifica: se è vero probabilmente ne generalizzerebbe alcuni.
Grazie per eventuali approfondimenti.