Che cos'è un "bagplot" o "boxpliv bivariato"?


11

Ho trovato un documento che introduce la versione multidimensionale (qui bivariata) del boxplot - un bagbag. Cos'è esattamente quel bagplot? Riesco a vedere la serie di poligoni nidificati basati su vertici, uno di quei poligoni che viene dichiarato come bagbag. Qual è l'idea della costruzione di poligoni nidificati? Quale dei poligoni è il bagplot (centrale o con il numero medio di punti)? I bordi di un bagplot possiedono alcune proprietà utili (come la divisione specifica del set di punti)?


3
C'è un articolo di Rousseeuw, Pits e Tukey in American Statistician che spiega questi. Per qualche motivo, ho difficoltà a incollare il collegamento, ma Google "bagplot" e "Tukey" lo troveranno
Peter Flom - Reinstalla Monica

1
L'ho trovato solo per un prezzo esagerato. Ancora cercando.
mbaitoff,

1
Se hai accesso a una biblioteca decente, dovrebbero averla. American Statistician è piuttosto abbonato a. C'era anche qualcosa su quora, ma non l'ho visto.
Peter Flom - Ripristina Monica

2
Rousseeuw e Ruts hanno un altro articolo online oltre a quello di American Statistician in formato Postscript gratuito.
Andy W,

@AndyW, Chiederti come compagno SPSS: come pensi che sia possibile farlo tramite GPL in qualche modo? Inventerai il codice per noi SPSSer?
ttnphns,

Risposte:


13

Ecco un esempio con le note:

Ecco l'articolo The Bagplot: A Bivariate Boxplotdi Peter J. Rousseeuw, Ida Ruts e John W. Tukey di The American Statistician: http://venus.unive.it/romanaz/ada2/bagplot.pdf

Dall'estratto di quell'articolo:

La "mediana della profondità" è la posizione più profonda ed è circondata da una "borsa" contenente le osservazioni n / 2 con la massima profondità. L'ingrandimento del sacchetto di un fattore 3 produce il "recinto" (che non è tracciato). Le osservazioni tra la borsa e la recinzione sono contrassegnate da un anello grigio chiaro, mentre le osservazioni all'esterno della recinzione sono contrassegnate come valori anomali. Il bagplot visualizza posizione, diffusione, correlazione, asimmetria e code dei dati.

Ecco un'illustrazione delle parti chiave:

inserisci qui la descrizione dell'immagine

Discussioni aggiuntive sono disponibili di seguito:

Dai documenti di aiuto del aplpackpacchetto (per Rutenti):

Un bagplot è una generalizzazione bivariata del noto boxplot. È stato proposto da Rousseeuw, Ruts e Tukey. Nel caso bivariato la scatola del boxplot si trasforma in uno scafo convesso, la borsa del bagplot. Nella borsa ci sono il 50 percento di tutti i punti. La recinzione separa i punti nella recinzione dai punti esterni. Viene calcolato aumentando la borsa. Il ciclo è definito come il poligono convesso che contiene tutti i punti all'interno della recinzione. Se tutti i punti sono su una linea retta si ottiene un classico diagramma a scatole. bagplot () traccia i grafici a trama molto simili a quello descritto in Rousseeuw et al. Osservazioni: la mediana bidimensionale è approssimativa. Ci sono difficoltà conosciute con piccoli set di dati (ma penso che non sia saggio fare un sommario (grafico) per esempio di 10 punti.)

Nel caso in cui le persone desiderino tracciare più bagbag (sovrapposti), è conveniente se i grafici sono semitrasparenti. Per questo motivo il flag di trasparenza è stato aggiunto al comando bagplot. Se la trasparenza == TRUE il livello alfa è impostato su '99' (esadecimale). Ciò fa apparire semi-trasparenti i grafici a bagaglio, ma SOLO se il dispositivo di output è PDF e aperto usando: pdf (file = "nomefile.pdf", versione = "1.4"). Per questo motivo, il valore predefinito è trasparenza == FALSO. Questa funzione e gli argomenti per specificare colori diversi sono stati proposti da Wouter Meuleman.

E un esempio:

library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight", 
        ylab="Miles Per Gallon",
        main="Bagplot Example", 
        transparency = TRUE, 
        show.whiskers = FALSE, 
        # note that data a 'fence' separates inliers from outliers, 
        # and a 'loop' indicates the points outside the bag but 
        # inside the fence. In the 'bag' are 50 percent of all 
        # points
        show.loophull = TRUE, # draw 'loop'?
        show.baghull = TRUE)  # draw 'bag'?

inserisci qui la descrizione dell'immagine

domande correlate:


4
Aggiornamento: qualcuno ha creato un geom ggplot2 per questo: gist.github.com/benmarwick/00772ccea2dd0b0f1745 . forse un utente intraprendente potrebbe trasformarlo in un pacchetto?
Shadowtalker,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.