Ho due campioni fortemente distorti e sto cercando di usare il bootstrap per confrontare i loro mezzi usando la statistica t.
Qual è la procedura corretta per farlo?
Il processo che sto usando
Sono preoccupato per l'adeguatezza dell'uso dell'errore standard dei dati originali / osservati nella fase finale quando so che questo non è normalmente distribuito.
Ecco i miei passi:
- Bootstrap - campione casuale con sostituzione (N = 1000)
- Calcola la statistica t per ogni bootstrap per creare una distribuzione t:
- Stimare gli intervalli di confidenza ottenendo e 1 - α / 2 percentili di distribuzione t
Ottieni intervalli di confidenza tramite:
- Guarda dove cadono gli intervalli di confidenza per determinare se c'è una differenza significativa nelle medie (cioè diversa da zero)
Ho anche esaminato la somma dei ranghi di Wilcoxon ma non sta dando risultati molto ragionevoli a causa della distribuzione molto distorta (ad esempio il 75 ° == 95 ° percentile). Per questo motivo, vorrei esplorare ulteriormente il test t di bootstrap.
Quindi le mie domande sono:
- È una metodologia appropriata?
- È appropriato utilizzare la SE dei dati osservati quando so che è fortemente distorta?
Possibile duplicato: quale metodo è preferito, un test di bootstrap o un test non parametrico basato su rango?