Intagli della trama della scatola rispetto all'intervallo Tukey-Kramer


10

Il documento di aiuto "notch" ( o testo originale ) dal boxplot in 'R' fornisce quanto segue:

Se le tacche di due grafici non si sovrappongono, si tratta di "prove evidenti" che le due mediane differiscono (Chambers et al, 1983, p. 62). Vedi boxplot.stats per i calcoli utilizzati.

e ' boxplot.stats ' fornisce quanto segue:

Le tacche (se richieste) si estendono a +/- 1,58 IQR / sqrt (n). Questo sembra basarsi sugli stessi calcoli della formula con 1,57 in Chambers et al (1983, p. 62), dato in McGill et al (1978, p. 16). Si basano sulla normalità asintotica della mediana e dimensioni del campione approssimativamente uguali per i due mediani confrontati e si dice che siano piuttosto insensibili alle distribuzioni sottostanti dei campioni. L'idea sembra essere quella di dare all'incirca un intervallo di confidenza del 95% per la differenza tra due mediane.

Ora ho più familiarità con l'uso della versione JMP del test Tukey-Kramer per confrontare i mezzi delle colonne. La documentazione per JMP fornisce questo:

Mostra un test dimensionato per tutte le differenze tra i mezzi. Questo è il test Tukey o Tukey-Kramer HSD (differenza onestamente significativa). (Tukey 1953, Kramer 1956). Questo test è un esatto test a livello alfa se le dimensioni del campione sono uguali e conservativo se le dimensioni del campione sono diverse (Hayter 1984).

Domanda: Qual è la natura della connessione tra i due approcci? C'è un modo per trasformare l'uno nell'altro?

Sembra che si stia cercando un IC approssimativo al 95% per la mediana e che si determini se vi è sovrapposizione; e l'altro è un "test alfa esatto" (i miei campioni hanno le stesse dimensioni) per determinare se le mediane di due serie di campioni si trovano entro un intervallo ragionevole l'una dall'altra.

Mi riferisco ai pacchetti, ma sono interessato alla matematica dietro la logica.

Risposte:


11

Per quanto riguarda il diagramma a scatole dentellato, il riferimento di McGill et al [1] menzionato nella tua domanda contiene dettagli piuttosto completi (non tutto ciò che dico qui è esplicitamente menzionato lì, ma tuttavia è sufficientemente dettagliato per capirlo).

L'intervallo è robusto ma basato su gaussiano

L'articolo cita il seguente intervallo per le tacche (dove è la mediana del campione e R è l'intervallo interquartile del campione):MR

M±1.7×1.25R/(1.35N)

dove:

  • 1.35σσR/1.35σ

  • 1.2514nf02f0f012πσ0,3989σ12Nf0=π/2σ/N1.253σ/N

    N

    1.25R/(1.35N)

  • Quindi tutto ciò che resta da discutere è il fattore 1,7.

    Si noti che se si confrontasse un campione con un valore fisso (diciamo una mediana ipotizzata) utilizzeremmo 1,96 per un test del 5%; di conseguenza, se avessimo due errori standard molto diversi (uno relativamente grande, uno molto piccolo), ciò riguarderebbe il fattore da utilizzare (poiché se il valore nullo fosse vero, la differenza sarebbe quasi interamente dovuta alla variazione in quello con maggiore errore standard e quello piccolo potrebbe - approssimativamente - essere trattato come riparato efficacemente).

    D'altra parte, se i due errori standard fossero gli stessi, 1,96 sarebbe un fattore troppo grande, poiché entrano in gioco entrambi i set di tacche - perché i due set di tacche non si sovrappongano, ne stiamo aggiungendo uno. Ciò renderebbe il fattore corretto1.96/21.386

    rr:11.96/1+1/r

Metterli tutti (1.35,1.25 e 1.7) insieme dà circa 1,57. Alcune fonti ottengono 1,58 calcolando l'1,35 o l'1,25 (o entrambi) in modo più accurato, ma come compromesso tra 1.386 e 1.96, che 1.7 non è nemmeno accurato con due cifre significative (è solo un valore di compromesso a sfera), quindi la precisione aggiuntiva è inutile (potrebbero anche aver arrotondato il tutto a 1.6 e averlo fatto).

Si noti che qui non ci sono aggiustamenti per confronti multipli da nessuna parte.


Esistono alcune analogie distinte nei limiti di confidenza per una differenza nell'HSD Tukey-Kramer :

y¯io-y¯j±qα;K;N-K2σ^ε1nio+1nj

Ma nota questo

  • c.1nio+1njK.1nioK.1nj1.961.96/2

  • si basa su mezzi, non su mediane (quindi non 1.35)

  • q2

Quindi, mentre molte delle idee alla base della forma dei componenti sono in qualche modo analoghe, in realtà sono piuttosto diverse in quello che stanno facendo.

[1] McGill, R., Tukey, JW e Larsen, WA (1978) Variazioni dei grafici a scatole. The American Statistician 32, 12–16.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.