Generalizziamo, in modo da concentrarci sul nocciolo della questione. Spiegherò i dettagli più piccoli in modo da non lasciare dubbi. L'analisi richiede solo quanto segue:
La media aritmetica di un insieme di numeri è definita comez1,…,zm
1m(z1+⋯+zm).
L'aspettativa è un operatore lineare. Cioè, quando sono variabili casuali e α i sono numeri, quindi l'aspettativa di una combinazione lineare è la combinazione lineare delle aspettative,Zi,i=1,…,mαi
E(α1Z1+⋯+αmZm)=α1E(Z1)+⋯+αmE(Zm).
Sia un campione ( B 1 , … , B k ) ottenuto da un set di dati x = ( x 1 , … , x n ) prendendo k elementi uniformemente da x con la sostituzione. Let m ( B ) sia la media aritmetica dei B . Questa è una variabile casuale. PoiB(B1,…,Bk)x=(x1,…,xn)kxm(B)B
E(m(B))=E(1k(B1+⋯+Bk))=1k(E(B1)+⋯+E(Bk))
segue la linearità delle aspettative. Poiché gli elementi di sono tutti ottenuti nello stesso modo, hanno tutti la stessa aspettativa, b dicono:Bb
E(B1)=⋯=E(Bk)=b.
Questo semplifica quanto sopra
E(m(B))=1k(b+b+⋯+b)=1k(kb)=b.
Per definizione, l'aspettativa è la somma dei valori ponderata in base alla probabilità. Poiché si presume che ciascun valore di abbia una pari probabilità di 1 / n di essere selezionato,X1/n
E(m(B))=b=E(B1)=1nx1+⋯+1nxn=1n(x1+⋯+xn)=x¯,
la media aritmetica dei dati.
Per rispondere alla domanda, se si usa la media dei dati per stimare la media della popolazione, allora anche la media bootstrap (che è il caso k = n ) è uguale a ˉ x , e quindi è identica a una stima della media della popolazione.x¯k=nx¯
Per le statistiche che non sono funzioni lineari dei dati, lo stesso risultato non è necessariamente valido. Tuttavia, sarebbe sbagliato semplicemente sostituire la media bootstrap al valore della statistica sui dati: non è così che funziona il bootstrap. Invece, confrontando la media bootstrap con la statistica dei dati otteniamo informazioni sulla distorsione della statistica. Questo può essere usato per regolare la statistica originale per rimuovere la distorsione. Pertanto, la stima corretta in base al bias diventa quindi una combinazione algebrica della statistica originale e della media bootstrap. Per ulteriori informazioni, cercare "BCa" (bootstrap accelerato e accelerato) e "ABC". Wikipedia fornisce alcuni riferimenti.