Quali sono i test statistici standard per vedere se i dati seguono distribuzioni esponenziali o normali?
Quali sono i test statistici standard per vedere se i dati seguono distribuzioni esponenziali o normali?
Risposte:
Sembra che tu stia cercando di decidere se modellare i tuoi dati usando la distribuzione normale o esponenziale. Mi sembra in qualche modo strano, poiché queste distribuzioni sono molto diverse l'una dall'altra.
La distribuzione normale è simmetrica mentre la distribuzione esponenziale è fortemente inclinata a destra, senza valori negativi. Tipicamente un campione dalla distribuzione esponenziale conterrà molte osservazioni relativamente vicine a e alcune obervazioni che si discostano molto a destra da . Questa differenza è spesso facile da vedere graficamente.0
Ecco un esempio in cui ho simulato osservazioni da una distribuzione normale con media e varianza e una distribuzione esponenziale con media e varianza :2 4 2 4
La simmetria della distribuzione normale e l'asimmetria dell'esponenziale possono essere viste usando istogrammi, grafici a scatole e diagrammi a dispersione, come illustrato nella figura sopra.
Un altro strumento molto utile è una trama QQ . Nell'esempio seguente, i punti dovrebbero seguire approssimativamente la linea se il campione proviene da una distribuzione normale. Come puoi vedere, questo è il caso dei dati normali, ma non dei dati esponenziali.
Se l'esame grafico per qualche motivo non è abbastanza per te, puoi comunque utilizzare un test per determinare se la tua distribuzione è normale o esponenziale. Poiché la distribuzione normale è una famiglia di scala e posizione, ti consigliamo di utilizzare un test invariante rispetto alle modifiche di scala e posizione (ad esempio, il risultato del test non dovrebbe cambiare se cambi le misure da pollici a centimetri o aggiungi a tutte le tue osservazioni).
Quando l'ipotesi nulla è che la distribuzione sia normale e l'ipotesi alternativa sia che sia esponenziale, il test invariante della posizione e della scala più potente è dato dalla statistica dove è la media del campione, è l'osservazione più piccola nel campione e è la deviazione standard del campione. La normalità viene respinta a favore dell'esponenzialità se è troppo grande.ˉ x x(1)sTE,N
Questo test è in realtà una versione unilaterale del test di Grubbs per gli outlier . Lo troverai implementato nella maggior parte dei software statistici (ma assicurati di utilizzare la versione giusta - ci sono diverse statistiche di test alternative utilizzate per il test anomalo!).
Il riferimento per è il test più potente: Sezione 4.2.4 di Test per la normalità di HC Thode.
Per la distribuzione esponenziale, puoi usare un test chiamato test di Moran o Bartlett. La statistica di prova riguarda la media di esempio e la media di esempio della registrata Sotto l'ipotesi nulla abbiamo approssimativamente e un test su due lati funzionano. Questo test è progettato contro alternative gamma.¯ Y ¯ log Y Y i B n = b n × { log ˉ Y - ¯ log Y } B n ∼ χ 2 ( n - 1 )
Scopri l' affidabilità di KC Kapur e LR Lamberson nella progettazione tecnica . Wiley 1977.
Per normalità Anderson-Darling e Shapiro-Wilk sono considerati i migliori. Per l'esponenziale test di Lillerfors è progettato appositamente per questo.
Hai considerato i metodi grafici per vedere come si comportano i dati?
Le tecniche del grafico di probabilità di solito comportano la classificazione dei dati, l'applicazione del CDF inverso e quindi la stampa dei risultati sul piano cartesiano. Ciò consente di vedere se diversi valori si discostano dalla distribuzione ipotizzata e probabilmente spiegano il motivo della deviazione.