Il metodo bootstrap ha visto una grande diffusione negli ultimi anni, lo uso anche molto, soprattutto perché il ragionamento alla base è abbastanza intuitivo.
Ma questa è una cosa che non capisco. Perché Efron ha scelto di eseguire il ricampionamento con sostituire invece di semplicemente sottocampionare includendo o escludendo casualmente singole osservazioni?
Penso che il sottocampionamento casuale abbia una qualità molto buona, che rappresenta idealmente la situazione di vita reale in cui le osservazioni che abbiamo nel nostro studio sono un sottoinsieme di una popolazione ipotetica. Non vedo il vantaggio di avere moltiplicato le osservazioni durante il ricampionamento. In un contesto reale nessuna osservazione è simile a un'altra, specialmente per situazioni multivariate complesse.