Recentemente ho usato il bootstrap per stimare gli intervalli di confidenza per un progetto. Qualcuno che non conosce molto sulle statistiche recentemente mi ha chiesto di spiegare perché il bootstrap funziona, ovvero perché il ricampionamento dello stesso campione più e più volte dà buoni risultati. Mi sono reso conto che, sebbene avessi trascorso molto tempo a capire come usarlo, non capisco davvero perché il bootstrap funzioni.
In particolare: se stiamo eseguendo il ricampionamento dal nostro campione, come stiamo imparando qualcosa sulla popolazione piuttosto che solo sul campione? Sembra che ci sia un salto che è in qualche modo contro-intuitivo.
Ho trovato alcune risposte a questa domanda qui che ho capito a metà. In particolare questo . Sono un "consumatore" di statistiche, non uno statistico, e lavoro con persone che sanno molto meno delle statistiche di me. Quindi, qualcuno può spiegare, con un minimo di riferimenti a teoremi, ecc., Il ragionamento di base dietro il bootstrap? Cioè, se dovessi spiegarlo al tuo vicino, cosa diresti?