Interpretazione del test di Shapiro-Wilk


29

Sono abbastanza nuovo nelle statistiche e ho bisogno del tuo aiuto.
Ho un piccolo campione, come segue:

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

Ho eseguito il test Shapiro-Wilk usando R:

shapiro.test(precisionH4U$H4U)

e ho ottenuto il seguente risultato:

 W = 0.9502, p-value = 0.6921

Ora, se presumo che il livello di significatività a 0,05 rispetto al valore p sia maggiore, allora alfa (0,6921> 0,05) e non posso rifiutare l'ipotesi nulla sulla distribuzione normale, ma mi permette di dire che il campione ha una distribuzione normale ?

Grazie!

Risposte:


28

No - non si può dire "il campione ha una distribuzione normale" o "il campione proviene da una popolazione che ha una distribuzione normale", ma solo "non si può respingere l'ipotesi che il campione provenga da una popolazione che ha una distribuzione normale".

In effetti il ​​campione non ha una distribuzione normale (vedere il qqplot di seguito), ma non ci si aspetterebbe che sia solo un campione. La domanda sulla distribuzione della popolazione sottostante rimane aperta.

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

QQPlot


2
il qqplot sembra piuttosto normale penso ... puoi provare qqnorm(rnorm(9))più volte ...
Curioso

2
@Tomas: Forse è meglio dire "il qqplot sembra provenire da una popolazione normale". Potrebbe invece provenire da una distribuzione con code più pesanti.
Henry,

Sì, qqnorm(runif(9))può produrre risultati simili. Quindi non possiamo davvero dire nulla ...
Curioso

qual è la differenza tra "il campione ha una distribuzione normale" e "il campione proviene da una popolazione che ha una distribuzione normale"?
auraham,

1
Una distribuzione normale è una distribuzione continua su tutti i reali. Un campione (finito o anche infinitamente numerabile) non può avere questo tipo di distribuzione stesso, anche se è estratto da una popolazione che ha questa distribuzione.
Henry,

17

Non riuscire a respingere un'ipotesi nulla indica che il campione che hai è troppo piccolo per raccogliere qualsiasi deviazione dalla normalità che hai - ma il tuo campione è così piccolo che probabilmente anche deviazioni abbastanza sostanziali dalla normalità non verranno rilevate.

Tuttavia, nella maggior parte dei casi, un test di ipotesi è praticamente al di fuori del punto in cui le persone usano un test di normalità per - in realtà conosci la risposta alla domanda che stai testando - la distribuzione della popolazione dai tuoi dati non viene disegnata non sarà normale . (Potrebbe essere abbastanza vicino a volte, ma in realtà normale?)

La domanda di cui dovresti preoccuparti non è "è la distribuzione che sono tratte dalla norma" (non lo sarà). La domanda a cui dovresti davvero preoccuparti è più simile a "è la deviazione dalla normalità che ho intenzione di influenzare materialmente i miei risultati?". Se questo è potenzialmente un problema, potresti prendere in considerazione un'analisi che ha meno probabilità di avere quel problema.


10

t

tt

Suppongo inoltre che tu stia osservando le proporzioni, nel qual caso potresti usare una distribuzione binomiale se fossi preoccupato per le violazioni delle ipotesi.

Se fosse un'altra preoccupazione che ti ha portato ai test di Shapiro, puoi ignorare tutto ciò che ho appena detto.


Hai capito bene, volevo sapere se posso usare il test t per il mio campione. Grazie!
Jakub,

4

Come già detto da Henry, non puoi dire che è normale. Prova a eseguire più volte il seguente comando in R:

shapiro.test(runif(9)) 

Questo testerà il campione di 9 numeri dalla distribuzione uniforme. Molte volte il valore p sarà molto maggiore di 0,05, il che significa che non è possibile concludere che la distribuzione sia normale.


4

Stavo anche cercando di interpretare correttamente il valore W nel test di Shapiro-Wilk e secondo l'articolo di Emil OW Kirkegaard " Valori W del test Shapiro-Wilk visualizzati con set di dati diversi " è molto difficile dire qualcosa sulla normalità di un distribuzione guardando solo il valore W.

Come afferma in conclusione:

Generalmente vediamo che, dato un ampio campione, SW è sensibile alle deviazioni dalla non normalità. Se la partenza è molto piccola, tuttavia, non è molto importante.

Vediamo anche che è difficile ridurre il valore W anche se si tenta deliberatamente. È necessario testare una distribuzione estremamente non normale per farlo scendere sensibilmente al di sotto di 0,99.

Vedi l'articolo originale per ulteriori informazioni.


1

Una questione importante non menzionata nella risposta precedente sono le limitazioni del test:

Il test presenta dei limiti, soprattutto il fatto che il test ha una propensione per dimensione del campione . Più grande è il campione, più è probabile che si ottenga un risultato statisticamente significativo.

Per rispondere alla domanda originale (dimensione del campione molto piccola): vedere i seguenti articoli su alternative migliori come il diagramma QQ e l'istogramma per questo caso specifico.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.