In R, ho un campione di 348 misure e voglio sapere se posso supporre che sia normalmente distribuito per test futuri.
Sostanzialmente seguendo un'altra risposta dello stack , sto guardando il diagramma della densità e il diagramma QQ con:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
Non ho una forte esperienza in Statistica, ma sembrano esempi di normali distribuzioni che ho visto.
Quindi sto eseguendo il test Shapiro-Wilk:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
Se lo interpreto correttamente, mi dice che è sicuro rifiutare l'ipotesi nulla, che è che la distribuzione è normale.
Tuttavia, ho riscontrato due messaggi Stack ( qui e qui ), che compromettono fortemente l'utilità di questo test. Sembra che se il campione è grande (348 è considerato grande?), Dirà sempre che la distribuzione non è normale.
Come dovrei interpretare tutto ciò? Devo attenermi al diagramma QQ e presumere che la mia distribuzione sia normale?


