Interpretazione del diagramma QQ


11

Considera il seguente codice e output:

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

inserisci qui la descrizione dell'immagine

Sembra che quel diagramma QQ per log-normal sia quasi uguale al diagramma QQ per weibull. Come possiamo distinguerli? Inoltre, se i punti si trovano all'interno della regione definita dalle due linee nere esterne, ciò indica che seguono la distribuzione specificata?


Credo che tu stia usando il pacchetto auto , vero? In tal caso, dovresti includere l'istruzione library(car)nel tuo codice per rendere più semplice il seguito da parte delle persone. In generale, potresti anche voler impostare il seed (ad esempio, set.seed(1)) per rendere riproducibile l'esempio, in modo che chiunque possa ottenere esattamente gli stessi punti dati che hai ottenuto, anche se probabilmente non è così importante qui.
gung - Ripristina Monica

2
Questo non funzionerà sul mio computer come scritto. Ad esempio, qqPlot dal pacchetto auto richiede la norma per normale e normale per il log-normale. Cosa mi sto perdendo?
Tom

2
@ Tom, mi sono sbagliato sul pacchetto. Evidentemente, è il pacchetto qualityTools . Inoltre, l'esempio sembra essere preso da qui .
gung - Ripristina Monica

Un'alternativa interessante è il grafico di Cullen e Frey, vedi stats.stackexchange.com/questions/243973/… per un esempio
kjetil b halvorsen,

Risposte:


12

Ci sono un paio di cose da dire qui:

  1. la forma del CDF per il log-normale è abbastanza simile alla forma del CDF del Weibull da renderli più difficili da distinguere rispetto al livello di somiglianza tra il Weibull e gli altri.
  2. le linee nere esterne formano una fascia di confidenza . L'uso della banda di confidenza nell'inferenza è uguale a qualsiasi altra forma standard di inferenza statistica frequentista. Cioè, quando i valori rientrano nella banda, non possiamo rifiutare l'ipotesi nulla che la distribuzione postulata sia quella corretta. Ciò non equivale a dire che sappiamo che la distribuzione proposta è quella corretta. (Si noti che questo è un ottimo esempio di ciò che ho discusso in un'altra risposta qui di una situazione in cui la prospettiva dei pescatori sui test di ipotesi sarebbe preferibile al Neyman-Pearson.)
  3. N

Esistono modi per esaminare le distribuzioni per campioni di piccole dimensioni?
protone,

in effetti sembra che i punti risiedano nelle bande di confidenza per tutte le distribuzioni. Quindi non possiamo distinguere le distribuzioni?
protone

1
n=205%

2
+1 sulla piccola dimensione del campione. L'uso di 300 campioni aiuterebbe a distinguere molto le cose. Proton: No, non puoi davvero distinguere le distribuzioni con un piccolo campione. Come hai potuto? È come cercare di identificare un volto con 20 pixel.
Wayne,

3

Sembra che quel diagramma QQ per log-normal sia quasi uguale al diagramma QQ per weibull.

Sì.

Come possiamo distinguerli?

A quella dimensione del campione, probabilmente non puoi.

Inoltre, se i punti si trovano all'interno della regione definita dalle due linee nere esterne, ciò indica che seguono la distribuzione specificata?

No. Indica solo che non puoi dire che la distribuzione dei dati è diversa da quella distribuzione. È la mancanza di prove di una differenza, non la prova di una mancanza di differenza.

Puoi essere quasi certo che i dati provengono da una distribuzione che non è una qualsiasi di quelle che hai preso in considerazione (perché dovrebbero provenire esattamente da una di quelle?).


Come il fraseggio: "È la mancanza di prove di una differenza, non la prova di una mancanza di differenza".
calunnia
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.