La mia distribuzione è normale; Il test di Kolmogorov-Smirnov non è d'accordo


15

Ho un problema con la normalità di alcuni dati che ho: ho fatto un test di Kolmogorov che dice che non è normale con p = .0000, non capisco: l'asimmetria della mia distribuzione = -. 497 e la curtosi = -0,024

Ecco la trama della mia distribuzione che sembra molto normale ...

(Ho tre punteggi e ognuno di questi punteggi non è normale con un valore p significativo per il test di Kolmogorov ... Davvero non capisco)

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine


11
Come fai a sapere che è normale? Non mi sembra normale. Sembra inclinato a sinistra.
mark999,

1
Perché stai testando la normalità?
Jack Aidley,

Risposte:


39
  1. Non hai basi per affermare che i tuoi dati sono normali. Anche se l'asimmetria e l'eccessiva curtosi erano entrambi esattamente 0, ciò non implica che i tuoi dati siano normali. Mentre l'asimmetria e la curtosi lontane dai valori previsti indicano una non normalità, il contrario non regge. Ci sono distribuzioni non normali che hanno la stessa inclinazione e curtosi della normale. Un esempio è discusso qui , la cui densità è riprodotta di seguito:
    dgam 2.3

    Come vedi, è decisamente bimodale. In questo caso, la distribuzione è simmetrica, quindi finché esistono momenti sufficienti, la tipica misura di asimmetria sarà 0 (in effetti tutte le misure abituali saranno). Per la kurtosi, il contributo ai 4i momenti dalla regione vicino alla media tenderà a ridurre la kurtosi, ma la coda è relativamente pesante, il che tende a ingrandirla. Se scegli il giusto, la curtosi viene fuori con lo stesso valore del normale.

  2. L'asimmetria del campione è in realtà intorno a -0,5, il che è indicativo di lieve asimmetria a sinistra. L'istogramma e il diagramma QQ indicano entrambi lo stesso: una distribuzione leggermente inclinata a sinistra. (È improbabile che una tale lieve asimmetria sia un problema per la maggior parte delle comuni procedure di teoria normale.)

  3. Stai esaminando diversi indicatori di non normalità che non dovresti aspettarti di concordare a priori , poiché prendono in considerazione diversi aspetti della distribuzione; con campioni lievemente non normali, spesso non sono d'accordo.


Ora per la grande domanda: * Perché stai testando la normalità? *

[modificato in risposta ai commenti:]

Non ne sono davvero sicuro, anche se avrei dovuto prima di fare un ANOVA

Ci sono un certo numero di punti da fare qui.

io. La normalità è un presupposto di ANOVA se lo si utilizza per deduzione (come il test di ipotesi), ma non è particolarmente sensibile alla non normalità in campioni più grandi - la non normalità lieve ha poca conseguenza e poiché le dimensioni del campione aumentano la distribuzione può diventare più non normale e il test potrebbe essere solo leggermente influenzato.

ii. Sembra che tu stia testando la normalità della risposta (DV). La distribuzione (incondizionata) del DV stesso non è considerata normale in ANOVA. Controlli i residui per valutare la ragionevolezza del presupposto sulla distribuzione condizionale (ovvero, è il termine di errore nel modello che si presume normale) - cioè non sembri guardare la cosa giusta. Infatti, poiché il controllo viene eseguito sui residui, lo si fa dopo l'adattamento del modello, piuttosto che prima.

iii. I test formali possono essere quasi inutili. La domanda di interesse qui è "quanto è grave il grado di non normalità che influenza la mia inferenza?", A cui il test di ipotesi in realtà non risponde. Man mano che la dimensione del campione aumenta, il test diventa sempre più in grado di rilevare banali differenze rispetto alla normalità, mentre l'effetto sul livello di significatività nell'ANOVA diventa sempre più piccolo. Cioè, se la dimensione del campione è ragionevolmente grande, il test di normalità ti dice principalmente che hai una dimensione del campione grande, il che significa che potresti non avere molto di cui preoccuparti. Almeno con un diagramma QQ hai una valutazione visiva di quanto non sia normale.

iv. a dimensioni del campione ragionevoli, altre ipotesi - come l'uguaglianza di varianza e l'indipendenza - in genere contano molto più della lieve non normalità. Preoccupati per le altre ipotesi prima ... ma ancora una volta, i test formali non rispondono alla domanda giusta

v. scegliere se eseguire un ANOVA o qualche altro test basato sull'esito di un test di ipotesi tende ad avere proprietà peggiori rispetto alla semplice decisione di agire come se l'assunto non fosse valido. (Esistono vari metodi adatti per analisi unidirezionali di tipo ANOVA su dati che non si presume siano normali e che è possibile utilizzare ogni volta che non si ritiene di avere motivo di assumere la normalità. Alcuni hanno un ottimo potere al normale, e con un software decente non c'è motivo di evitarli.)

[Credo di avere un riferimento per quest'ultimo punto ma non riesco a individuarlo in questo momento; se lo trovo, proverò a tornare e a inserirlo]


Ho letto il tuo istogramma come mostrando approssimativamente min 12 modalità 48 max 60, quindi min a modalità è 36, modalità a max è 12. Non si dovrebbe leggere troppo in tali dettagli, ma sono del tutto coerenti con l'asimmetria sinistra.
Nick Cox,

10

Il test Kolmogorov-Smirnov ha un bel po 'di potenza quando le dimensioni dei campioni sono grandi, quindi può essere facile rifiutare l'ipotesi nulla che i tuoi dati non differiscano dalla normalità. In altre parole, il test a volte suggerirà che una distribuzione non è normale in campioni di grandi dimensioni anche se è normale per la maggior parte delle intenzioni.

Pensalo come un test t. Se hai due popolazioni che differiscono in altezza di solo un millesimo di millimetro, un campione incredibilmente grande supporterà statisticamente che queste sono diverse, anche se la differenza non ha senso.

Forse puoi fare affidamento su altri metodi per determinare la normalità dei tuoi dati. I grafici che usi sono due buoni esempi, oltre ai valori di inclinazione / curtosi.

Quest'altro argomento sembra particolarmente correlato: i test sulla normalità sono "sostanzialmente inutili"?


Oh ok, funziona bene, la mia dimensione del campione è piuttosto grande (n = 660), c'è qualche altro test che è meno distorto dall'enorme dimensione del campione?
Boo,

Effettua una ricerca su questo sito e puoi trovare risposte pertinenti. stats.stackexchange.com/questions/12261/testing-normalit stats.stackexchange.com/questions/2492/…
Behacad

13
I test non sono influenzati dall'enorme dimensione del campione.
Peter Flom - Ripristina Monica

10

Il test di Kolmogorov – Smirnov è esente da distribuzione quando l'ipotesi nulla è completamente specificata - se la media e la varianza sono stimate dai dati assicurati di usare la variante di Lilliefors durante il test della normalità (se necessario). Non è per dire le altre risposte.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.