Non puoi fare quel tipo di sottoinsiemi con $
. Nel codice sorgente ( R/src/main/subset.c
) afferma:
/ * L'operatore $ subset.
Dobbiamo essere sicuri di valutare solo il primo argomento.
Il secondo sarà un simbolo che deve essere abbinato, non valutato.
* /
Secondo argomento? Che cosa?! Dovete capire che $
, come tutto il resto in R, (tra cui per esempio (
, +
, ^
ecc) è una funzione, che prende argomenti e viene valutata. df$V1
potrebbe essere riscritto come
`$`(df , V1)
o addirittura
`$`(df , "V1")
Ma...
`$`(df , paste0("V1") )
... per esempio non funzionerà mai, né qualsiasi altra cosa che deve essere valutata prima nel secondo argomento. Puoi solo passare una stringa che non viene mai valutata.
Usa invece [
(o [[
se vuoi estrarre solo una singola colonna come vettore).
Per esempio,
var <- "mpg"
#Doesn't work
mtcars$var
#These both work, but note that what they return is different
# the first is a vector, the second is a data.frame
mtcars[[var]]
mtcars[var]
È possibile eseguire l'ordinamento senza loop, utilizzando do.call
per costruire la chiamata a order
. Di seguito è riportato un esempio riproducibile:
# set seed for reproducibility
set.seed(123)
df <- data.frame( col1 = sample(5,10,repl=T) , col2 = sample(5,10,repl=T) , col3 = sample(5,10,repl=T) )
# We want to sort by 'col3' then by 'col1'
sort_list <- c("col3","col1")
# Use 'do.call' to call order. Seccond argument in do.call is a list of arguments
# to pass to the first argument, in this case 'order'.
# Since a data.frame is really a list, we just subset the data.frame
# according to the columns we want to sort in, in that order
df[ do.call( order , df[ , match( sort_list , names(df) ) ] ) , ]
col1 col2 col3
10 3 5 1
9 3 2 2
7 3 2 3
8 5 1 3
6 1 5 4
3 3 4 4
2 4 3 4
5 5 1 4
1 2 5 5
4 5 3 5