Ho alcuni dati che sembrano tracciare un grafico dei residui rispetto al tempo quasi normale, ma voglio esserne sicuro. Come posso verificare la normalità dei residui di errore?
Ho alcuni dati che sembrano tracciare un grafico dei residui rispetto al tempo quasi normale, ma voglio esserne sicuro. Come posso verificare la normalità dei residui di errore?
Risposte:
Nessun test ti dirà che i tuoi residui sono normalmente distribuiti. In realtà, si può attendibilmente scommettere che essi sono non .
I test di ipotesi non sono generalmente una buona idea come controlli sui tuoi presupposti. L'effetto di non normalità sulla vostra deduzione non è generalmente una funzione della dimensione del campione *, ma il risultato di un test di significatività è . Una piccola deviazione dalla normalità sarà evidente a grandi dimensioni del campione anche se la risposta alla domanda di interesse reale ("in che misura questo ha influito sulla mia inferenza?") Potrebbe essere "quasi del tutto". Di conseguenza, una grande deviazione dalla normalità con una piccola dimensione del campione potrebbe non avvicinarsi alla significatività.
* (aggiunto in modifica) - in realtà è un'affermazione troppo debole. L'impatto della non normalità in realtà diminuisce con le dimensioni del campione praticamente ogni volta che il CLT e il teorema di Slutsky manterranno, mentre la capacità di rifiutare la normalità (e presumibilmente evitare le procedure della teoria normale) aumenta con le dimensioni del campione ... quindi proprio quando sei più in grado di identificare la non normalità che tende ad essere quando non importa comunque ... e il test non è di aiuto quando effettivamente conta, in piccoli campioni.
bene, almeno per quanto riguarda il livello di significatività. Il potere può comunque essere un problema, se stiamo prendendo in considerazione campioni di grandi dimensioni come qui, anche questo potrebbe essere un problema minore.
Ciò che si avvicina alla misurazione della dimensione dell'effetto è una diagnostica (un display o una statistica) che misura il grado di non normalità in qualche modo. Un diagramma QQ è una visualizzazione ovvia, e un diagramma QQ della stessa popolazione con una dimensione del campione e con una dimensione del campione diversa sono almeno entrambe le stime rumorose della stessa curva - mostrando all'incirca la stessa "non normalità"; dovrebbe almeno essere approssimativamente monotonicamente correlato alla risposta desiderata alla domanda di interesse.
Se devi usare un test, Shapiro-Wilk è probabilmente buono come qualsiasi altra cosa (il test Chen-Shapiro è in genere un po 'meglio su alternative di interesse comune, ma è più difficile trovare implementazioni di) - ma sta rispondendo a una domanda che conosco già la risposta a; ogni volta che non si rifiuta, si sta dando una risposta, si può essere sicuri che sia sbagliato.
Il test Shapiro-Wilk è una possibilità.
Questo test è implementato in quasi tutti i pacchetti software statistici. L'ipotesi nulla è che i residui siano normalmente distribuiti, quindi un piccolo valore p indica che dovresti rifiutare il valore nullo e concludere che i residui non sono normalmente distribuiti.
Si noti che se la dimensione del campione è grande, si rifiuta quasi sempre, quindi la visualizzazione dei residui è più importante.
Da Wikipedia:
I test di normalità univariata includono il test K-quadrato di D'Agostino, il test Jarque – Bera, il test Anderson – Darling, il criterio Cramér – von Mises, il test Lilliefors per la normalità (a sua volta un adattamento del test Kolmogorov – Smirnov), Test di Shapiro-Wilk, test chi-quadrato di Pearson e test di Shapiro-Francia. Un articolo del 2011 del Journal of Statistical Modeling and Analytics [1] conclude che Shapiro-Wilk ha il miglior potere per un determinato significato, seguito da vicino da Anderson-Darling quando si confrontano Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors e Anderson- Test cari.