Valutazioni di "Approssimativamente normale" per i test t


12

Sto testando l'uguaglianza dei mezzi usando il test t di Welch. La distribuzione sottostante è tutt'altro che normale (più distorta dell'esempio in una discussione correlata qui ). Posso ottenere più dati, ma vorrei un modo di principio per determinare fino a che punto farlo.

  1. Esiste una buona euristica per valutare se la distribuzione del campione è accettabile? Quali deviazioni dalla normalità sono più preoccupanti?
  2. Esistono altri approcci, ad esempio basarsi su un intervallo di confidenza bootstrap per la statistica di esempio, che avrebbe più senso?

2
Questa è un'ottima domanda A parte il test della normalità "è sostanzialmente inutile"? (già collegati), altre due domande correlate sono Come scegliere tra test t o test non parametrico, ad es. Wilcoxon in piccoli campioni? e T-test per non normale quando N> 50? Una buona risposta a questa domanda sarebbe potenzialmente utile per i lettori di queste due domande correlate.
Silverfish,

Per quanto ne so, non esistono metodi di principio per determinare la quantità di dati necessari affinché la distribuzione sia "abbastanza normale". Questo perché "abbastanza normale" è difficile da definire, e dipenderebbe da quanto non normale sia la distribuzione sottostante, oltre al modo particolare in cui ti stai allontanando dalla normalità. Se hai dati seriamente non normali, utilizzerei invece un test non parametrico. L'aspetto negativo è che non sarai in grado di ottenere intervalli di confidenza che sono più utili dei test di ipotesi solitari.
Dsaxton,

2
Concordo sul fatto che "abbastanza normale" è difficile da definire, ma ogni professionista deve fare la valutazione prima di ragionare sui dati empirici, motivo per cui sono sorpreso di quanto poca discussione sono stato in grado di scoprire (forse sto guardando in posti sbagliati) . Per i casi d'uso che ho in mente qui (che sembrano abbastanza comuni) i test non parametrici sono insoddisfacenti rispetto alla raccolta di più dati per garantire una distribuzione del campionamento "abbastanza normale".
cohoz,

Risposte:


1

Poiché il test t assume la normalità e le distribuzioni sottostanti non sono normali, non può esistere un modo di principio per determinare che la distribuzione del campione sia accettabile. Tuttavia, quando la dimensione del campione diventa "grande", entra in gioco il Teorema del limite centrale e puoi usare un grande z-test di esempio, che ti darà essenzialmente la stessa risposta di un test t perché la t si avvicina alla distribuzione normale con grandi campioni.

I libri / corsi di statistica spesso implicano che una dimensione del campione di 25 o 30 CLT entra in gioco in modo utile. Tuttavia, la mia esperienza è stata che anche con campioni di dimensioni pari a centinaia di z-test di campioni di grandi dimensioni possono essere ancora piuttosto scarsi (ad esempio, con i dati di conteggio).

Secondo me, un test di permutazione è adatto al tuo problema. Dovrebbe avere un potere uguale o migliore rispetto ai test non parametrici in scatola (ad esempio, Mann-Whitney) e non devi preoccuparti del problema della normalità. E sono divertenti da scrivere.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.