Ho un campione (di dimensioni 250) da una popolazione. Non conosco la distribuzione della popolazione.
La domanda principale: voglio una stima puntuale del primo percentile della popolazione, e quindi voglio un intervallo di confidenza del 95% attorno alla mia stima puntuale.
La mia stima puntuale sarà il primo campione del primo . Lo dico .
Successivamente, provo a costruire l'intervallo di confidenza attorno alla stima puntuale. Mi chiedo se abbia senso usare bootstrap qui. Sono molto inesperto con bootstrap, quindi scusate se non uso la terminologia appropriata ecc.
Ecco come ho provato a farlo. Traccio 1000 campioni casuali con la sostituzione dal mio campione originale. Ottengo il 1 ° -percentile da ciascuno di essi. Così ho 1000 punti - "il 1 ° -percentiles". Guardo la distribuzione empirica di questi 1000 punti. Indico la media di esso . Indico un "bias" come segue: . Prendo il 2,5 ° -percentile e 97,5 ° percentile della 1000 punti per ottenere il più basso e più alto delle quello che io chiamo un intervallo di confidenza del 95% in tutto il 1 ° -percentile del campione originale. questi punti e . bias = x m e a n - x x 0,025 x 0,975
L'ultimo passo che rimane è di adattare questo intervallo di confidenza essere intorno al 1 ° -percentile della popolazione , piuttosto che intorno al 1 ° -percentile del campione originale . Quindi prendo come estremità inferiore e come estremità superiore dell'intervallo di confidenza al 95% attorno alla stima puntuale della popolazione 1 st -percentile. Quest'ultimo intervallo è quello che stavo cercando.x - bias + ( x 0.975 - x m e a n )
Un punto cruciale , secondo me, è se ha senso usare bootstrap per il primo percento che è piuttosto vicino alla coda della distribuzione sconosciuta alla base della popolazione. Ho il sospetto che potrebbe essere problematico; pensa a usare bootstrap per costruire un intervallo di confidenza attorno ad un minimo (o un massimo).
Ma forse questo approccio è imperfetto? Per favore mi faccia sapere.
MODIFICARE:
Avendo pensiero circa il problema un po 'più, vedo che la mia soluzione implica la seguente: l'empirico 1 ° percentile del campione originale può essere uno stimatore distorto del 1 ° percentile della popolazione. E in tal caso, la stima puntuale dovrebbe essere modificata in base al bias: . Altrimenti, l'intervallo di confidenza aggiustato per il bias non sarebbe compatibile con la stima del punto di bias non aggiustato. Devo regolare sia la stima puntuale che l'intervallo di confidenza o nessuno di essi.
Se, d'altra parte, non consentissi che la stima fosse distorta, non avrei dovuto effettuare la correzione del bias. Cioè, prenderei come stima del punto e come estremità inferiore e come estremità superiore del 95% intervallo di confidenza. Non sono sicuro che questo intervallo abbia senso ...x - ( x m e a n - x 0.025 ) x + ( x 0.975 - x m e a n )
Così fa alcun senso assumere che il campione 1 ° percentile è una stima di parte della popolazione 1 ° percentile? E se no, la mia soluzione alternativa è corretta?