Qual è la differenza tra il test di normalità di Shapiro-Wilk e il test di normalità di Kolmogorov-Smirnov?


Risposte:


23

Non puoi nemmeno confrontare i due poiché Kolmogorov-Smirnov è per una distribuzione completamente specificata (quindi se stai testando la normalità, devi specificare la media e la varianza; non possono essere stimati dai dati *), mentre Shapiro-Wilk è per la normalità, con media e varianza non specificate.

* non è inoltre possibile standardizzare utilizzando i parametri stimati e testare lo standard normale; è in realtà la stessa cosa.

Un modo per confrontare sarebbe integrare Shapiro-Wilk con un test per media e varianza specificate in modo normale (combinando i test in qualche modo), o facendo aggiustare le tabelle KS per la stima dei parametri (ma poi non è più la distribuzione -gratuito).

Esiste un tale test (equivalente al Kolmogorov-Smirnov con parametri stimati) - il test di Lilliefors; la versione del test di normalità potrebbe essere validamente paragonata a quella di Shapiro-Wilk (e avrà generalmente una potenza inferiore). Più competitivo è il test Anderson-Darling (che deve anche essere adattato per la stima dei parametri affinché un confronto sia valido).


Per quanto riguarda ciò che testano, il test KS (e Lilliefors) esamina la più grande differenza tra il CDF empirico e la distribuzione specificata, mentre Shapiro Wilk confronta effettivamente due stime di varianza; la Shapiro-Francia strettamente correlata può essere considerata una funzione monotonica della correlazione al quadrato in un diagramma QQ; se ricordo bene, lo Shapiro-Wilk tiene conto anche delle covarianze tra le statistiche dell'ordine.

t30n>60

[Va tenuto presente che esistono molti più test per la normalità disponibili rispetto a questi.]


Questa è una risposta interessante, ma ho qualche problema a capire come quadrare con la pratica. Forse queste dovrebbero essere domande diverse, ma qual è la conseguenza dell'ignorare la stima dei parametri nel test KS? Ciò implica che il test di Lillefors ha meno potenza di un KS condotto in modo errato in cui i parametri sono stati stimati dai dati?
Russellpierce,

@rpierce - L'impatto principale del trattamento dei parametri stimati come noto è di ridurre drasticamente il livello di significatività effettiva (e quindi la curva di potenza) da quello che dovrebbe essere se si tiene conto di esso (come fa il Lilliefors). Cioè, il Lilliefors è il KS "fatto bene" per la stima dei parametri e ha un potere sostanzialmente migliore rispetto al KS. D'altra parte, i Lilliefors hanno un potere molto peggiore di quanto affermano i test di Shapiro-Wilk. In breve, il KS non è un test particolarmente potente per cominciare, e peggioriamo ignorando che stiamo facendo la stima dei parametri.
Glen_b -Restate Monica

... tenendo presente che quando diciamo "potere migliore" e "potere peggiore", ci riferiamo generalmente al potere contro ciò che le persone generalmente considerano un tipo interessante di alternative.
Glen_b -Restate Monica

1
Ho visto una curva di potenza, ma non ho pensato a cosa significherebbe un abbassamento o innalzamento di esso e invece Dio si è attaccato al tuo secondo commento a partire: "tenere a mente". In qualche modo mi sono girato e ho pensato che stavi dicendo che il potere "migliore" significava avere la curva di potere dove "doveva" trovarsi. Che forse stavamo tradendo e ottenendo un potere irrealistico nel KS perché gli stavamo consegnando parametri che avrebbero dovuto essere penalizzati per la stima (perché è quello a cui sono abituato come conseguenza per non riconoscere che un parametro deriva da una stima) .
Russellpierce,

1
Non sono sicuro di come ho perso questi commenti prima, ma sì, i valori p calcolati dall'uso del test KS con parametri stimati come se fossero noti / specificati tenderanno ad essere troppo alti. Provalo in R: hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))- se i valori p fossero come dovrebbero essere, sembrerebbero uniformi!
Glen_b

24

In breve, il test di Shapiro-Wilk è un test specifico per la normalità, mentre il metodo usato dal test di Kolmogorov-Smirnov è più generale, ma meno potente (nel senso che rifiuta correttamente l'ipotesi nulla della normalità meno spesso). Entrambe le statistiche prendono la normalità come nulla e stabiliscono una statistica di prova basata sul campione, ma il modo in cui lo fanno è diverso l'uno dall'altro in modo da renderli più o meno sensibili alle caratteristiche delle normali distribuzioni.

Come viene calcolato esattamente W (la statistica del test per Shapiro-Wilk) è un po 'coinvolto , ma concettualmente comporta la raccolta dei valori del campione per dimensione e la misura dell'adattamento rispetto alle medie, varianze e covarianze previste. Questi paragoni multipli contro la normalità, a quanto ho capito, danno al test più potenza del test di Kolmogorov-Smirnov, che è un modo in cui possono differire.

Al contrario, il test di Kolmogorov-Smirnov per la normalità deriva da un approccio generale per valutare la bontà dell'adattamento confrontando la distribuzione cumulativa attesa con la distribuzione cumulativa empirica, in riferimento a:

testo alternativo

Come tale, è sensibile al centro della distribuzione e non le code. Tuttavia, il test KS è convergente, nel senso che siccome n tende all'infinito, il test converge alla vera risposta in probabilità (credo che il teorema di Glivenko-Cantelli si applichi qui, ma qualcuno potrebbe correggermi). Questi sono altri due modi in cui questi due test potrebbero differire nella loro valutazione della normalità.


3
Inoltre ... Il test di Shapiro-Wilk viene spesso utilizzato per stimare le deviazioni dalla normalità in piccoli campioni. Ottima risposta, John! Grazie.
aL3xa

+1, altre due note su KS: può essere usato per testare qualsiasi distribuzione importante (mentre SW è solo per la normalità), e la potenza inferiore potrebbe essere una buona cosa con campioni più grandi.
gung - Ripristina Monica

In che modo la potenza inferiore è una buona cosa? Fintanto che il Tipo I rimane lo stesso, la potenza superiore non è sempre migliore? Inoltre, la KS non è generalmente meno potente, forse solo per la leptokurtosi? Ad esempio, KS è molto più potente per l'inclinazione senza un aumento commisurato degli errori di tipo 1.
Giovanni

Il Kolmogorov-Smirnov è per una distribuzione completamente specificata. Lo Shapiro Wilk non lo è. Non possono essere confrontati ... perché non appena si apportano le modifiche necessarie per renderle comparabili, non si ha più l'uno o l'altro test .
Glen_b

Trovato questo studio di simulazione, nel caso in cui aggiunga qualcosa di utile in termini di dettagli. Stessa conclusione generale di cui sopra: il test di Shapiro-Wilk è più sensibile. ukm.my/jsm/pdf_files/SM-PDF-40-6-2011/15%20NorAishah.pdf
Nick Stauner
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.