Ho alcuni dati multivariati di bellezza e età. L'età varia da 20 a 40 a intervalli di 2 (20, 22, 24 .... 40) e per ogni registrazione di dati viene assegnata un'età e una valutazione di bellezza da 1-5. Quando eseguo grafici a scatole di questi dati (età sull'asse X, valutazioni di bellezza sull'asse Y), ci sono alcuni valori anomali tracciati fuori dai baffi di ogni riquadro.
Voglio rimuovere questi valori anomali dal data frame stesso, ma non sono sicuro di come R calcoli i valori anomali per i suoi box plot. Di seguito è riportato un esempio di come potrebbero apparire i miei dati.
boxplot
funzione restituisce i valori anomali (tra le altre statistiche) in modo invisibile. Prova afoo <- boxplot(...); foo
leggere?boxplot
per capire l'output.