Ho appena appreso il concetto di bootstrap e mi è venuta in mente una domanda ingenua: se possiamo sempre generare numerosi campioni bootstrap dei nostri dati, perché preoccuparsi di ottenere più dati "reali"?
Penso di avere una spiegazione, per favore dimmi se sono corretto: penso che il processo di bootstrap riduca la varianza, MA se il mio set di dati originale è BIASED, che sono bloccato con bassa varianza e distorsione elevata, non importa quante repliche Sto prendendo.