Il documento di aiuto "notch" ( o testo originale ) dal boxplot in 'R' fornisce quanto segue:
Se le tacche di due grafici non si sovrappongono, si tratta di "prove evidenti" che le due mediane differiscono (Chambers et al, 1983, p. 62). Vedi boxplot.stats per i calcoli utilizzati.
e ' boxplot.stats ' fornisce quanto segue:
Le tacche (se richieste) si estendono a +/- 1,58 IQR / sqrt (n). Questo sembra basarsi sugli stessi calcoli della formula con 1,57 in Chambers et al (1983, p. 62), dato in McGill et al (1978, p. 16). Si basano sulla normalità asintotica della mediana e dimensioni del campione approssimativamente uguali per i due mediani confrontati e si dice che siano piuttosto insensibili alle distribuzioni sottostanti dei campioni. L'idea sembra essere quella di dare all'incirca un intervallo di confidenza del 95% per la differenza tra due mediane.
Ora ho più familiarità con l'uso della versione JMP del test Tukey-Kramer per confrontare i mezzi delle colonne. La documentazione per JMP fornisce questo:
Mostra un test dimensionato per tutte le differenze tra i mezzi. Questo è il test Tukey o Tukey-Kramer HSD (differenza onestamente significativa). (Tukey 1953, Kramer 1956). Questo test è un esatto test a livello alfa se le dimensioni del campione sono uguali e conservativo se le dimensioni del campione sono diverse (Hayter 1984).
Domanda: Qual è la natura della connessione tra i due approcci? C'è un modo per trasformare l'uno nell'altro?
Sembra che si stia cercando un IC approssimativo al 95% per la mediana e che si determini se vi è sovrapposizione; e l'altro è un "test alfa esatto" (i miei campioni hanno le stesse dimensioni) per determinare se le mediane di due serie di campioni si trovano entro un intervallo ragionevole l'una dall'altra.
Mi riferisco ai pacchetti, ma sono interessato alla matematica dietro la logica.