Mi chiedevo come si comportano i CI di bootstrap (e BCa in barticolare) su dati normalmente distribuiti. Sembra che ci sia molto lavoro per esaminare le loro prestazioni su vari tipi di distribuzioni, ma non è stato possibile trovare nulla sui dati normalmente distribuiti. Dal momento che sembra una cosa ovvia studiare prima, suppongo che i documenti siano troppo vecchi.
Ho fatto alcune simulazioni Monte Carlo usando il pacchetto di avvio R e ho scoperto che i CI di bootstrap erano in accordo con i CI di esattezza, sebbene per i piccoli campioni (N <20) tendano a essere un po 'liberali (CI di dimensioni minori). Per campioni abbastanza grandi, sono essenzialmente gli stessi.
Questo mi fa chiedermi se ci sia qualche buona ragione per non usare sempre il bootstrap. Data la difficoltà di valutare se una distribuzione è normale e le numerose insidie dietro a ciò, sembra ragionevole non decidere e segnalare elementi di configurazione bootstrap indipendentemente dalla distribuzione. Capisco la motivazione per non usare sistematicamente test non parametrici, poiché hanno meno potenza, ma le mie simulazioni mi dicono che questo non è il caso degli EC di bootstrap. Sono ancora più piccoli.
Una domanda simile che mi dà fastidio è perché non usare sempre la mediana come misura della tendenza centrale. Le persone spesso raccomandano di usarlo per caratterizzare i dati non distribuiti normalmente, ma poiché la mediana è la stessa media dei dati distribuiti normalmente, perché fare una distinzione? Sembrerebbe abbastanza utile se potessimo sbarazzarci delle procedure per decidere se una distribuzione è normale o meno.
Sono molto curioso dei tuoi pensieri su questi temi e se sono stati discussi in precedenza. I riferimenti sarebbero molto apprezzati.
Grazie!
Pierre