Bootstrap può essere utilizzato per sostituire i test non parametrici?


15

Sono abbastanza nuovo nelle statistiche. Il concetto di bootstrap è stato confuso per me.

So che la normalità della distribuzione del campionamento è necessaria per utilizzare determinati test come il test t. Nei casi in cui i dati non vengono normalmente distribuiti, richiedendo il "bootstrap" nei test t in SPSS ciò aggirerebbe il problema della non normalità? In tal caso, la statistica t riportata nell'output si basa sulla distribuzione di campionamento avviata?

Inoltre, questo sarebbe un test migliore rispetto all'utilizzo di test non parametrici come Mann-Whitney o Kruskal-Wallis nei casi in cui ho dati non normali? In situazioni in cui i dati non sono normali e sto usando bootstrap non segnalerei la statistica t: giusto?

Risposte:


16

Il bootstrap funziona senza bisogno di presupposti come la normalità, ma può essere molto variabile quando la dimensione del campione è piccola e la popolazione non è normale. Quindi può essere migliore nel senso delle affermazioni, ma non è migliore in tutti i modi.

Il bootstrap campiona con sostituzione, test di permutazione campione senza sostituzione. Mann-Whitney e altri test non parametrici sono in realtà casi speciali del test di permutazione. In realtà preferisco il test di permutazione qui perché è possibile specificare una statistica test significativa.

La decisione su quale test usare deve essere basata sulla domanda a cui si deve rispondere e sulla conoscenza della scienza che porta ai dati. Il teorema del limite centrale ci dice che possiamo ancora ottenere ottime approssimazioni dai test t anche quando la popolazione non è normale. Quanto sono buone le approssimazioni dipende dalla forma della distribuzione della popolazione (non dal campione) e dalle dimensioni del campione. Ci sono molti casi in cui un test t è ancora ragionevole per campioni più piccoli (e alcuni casi in cui non è abbastanza buono in campioni molto grandi).


Grazie è utile Quindi, se uso il bootstrap, segnalerei solo il valore p e CI senza alcuna statistica di test, è corretto?
JC22

(+1) Avresti per caso un riferimento o un link relativo a Mann-Whitney e ai test di permutazione? È molto interessante ma non ovvio per me!
Gala,

4
@ JC22 Si dovrebbe segnalare una statistica test (qualunque statistica il bootstrap); un test bootstrap basato su una media sarà diverso da uno basato su una media tagliata, ad esempio.
Glen_b

2
@ GaëlLaurans Per un esempio di generazione della distribuzione esatta (permutazione) della statistica del test di somma dei ranghi di Wilcoxon (equivalente a Mann-Whitney) e della statistica del test di Kruskal-Wallis, vedere questa risposta .
Caracal,

2
@ GaëlLaurans, il riferimento è: Diversi risultati del test Wilcoxon — Mann — Whitney da diversi pacchetti statistici Reinhard Bergmann, John Ludbrook e Will PJM Spooren Journal: The American StatisticianVolume 54, Issue 1, February 2000, page 72-77
Greg Snow
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.