Invece di fare affidamento su un test per la normalità dei residui, prova a valutare la normalità con un giudizio razionale. I test di normalità non ti dicono che i tuoi dati sono normali, solo che non lo sono. Ma dato che i dati sono un campione, puoi essere certo che non sono effettivamente normali senza un test. Il requisito è approssimativamente normale. Il test non te lo può dire. I test diventano anche molto sensibili a grandi N o, più seriamente, variano in sensibilità con N. La tua N è in quel range in cui la sensibilità inizia ad aumentare. Se esegui la seguente simulazione in R un numero di volte e guardi i grafici, vedrai che il test di normalità sta dicendo "non normale" su un buon numero di distribuzioni normali.
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
Si spera che, dopo aver superato le simulazioni, si possa vedere che un test di normalità può facilmente rifiutare dati dall'aspetto abbastanza normale e che i dati di una distribuzione normale possono sembrare abbastanza lontani dal normale. Se vuoi vedere un valore estremo di quello prova n <- 1000
. Le distribuzioni appariranno tutte normali ma continueranno a non superare il test alla stessa velocità dei valori N inferiori. E viceversa, con una bassa N distribuzioni che superano il test possono sembrare molto lontane dalla norma.
Il diagramma residuo standard in SPSS non è estremamente utile per valutare la normalità. Puoi vedere gli outlier, la gamma, la bontà di adattamento e forse anche la leva. Ma è difficile derivarne la normalità. Prova la seguente simulazione confrontando istogrammi, grafici normali quantile-quantili e grafici residui.
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
È straordinariamente difficile distinguere la normalità, o molto altro, dall'ultima trama e quindi non terribilmente diagnostico della normalità.
In sintesi, si raccomanda generalmente di non fare affidamento sui test di normalità ma piuttosto su grafici diagnostici dei residui. Senza quelle trame o i valori reali nella tua domanda, è molto difficile per chiunque darti solidi consigli su ciò di cui i tuoi dati hanno bisogno in termini di analisi o trasformazione. Per ottenere il miglior aiuto, fornire i dati non elaborati.