Domande taggate «data.table»

Il pacchetto R data.table è un'estensione di data.frame creata per un'analisi rapida dei dati in memoria. Usa il tag dt per il pacchetto DataTables con Shiny (DT).

8
Converti le classi di colonne in data.table
Ho un problema con data.table: come posso convertire le classi di colonne? Ecco un semplice esempio: con data.frame non ho problemi a convertirlo, con data.table non so proprio come: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way df[, "value"] <- …
118 r  data.table 

2
Qual è lo scopo di impostare una chiave in data.table?
Sto usando data.table e ci sono molte funzioni che richiedono di impostare una chiave (ad esempio X[Y]). Come tale, desidero capire cosa fa una chiave per impostare correttamente le chiavi nelle mie tabelle di dati. Una fonte che ho letto è stata ?setkey. setkey()ordina un data.tablee lo contrassegna come ordinato. …
113 r  data.table 

8
Pulizia dei valori "Inf" da un dataframe R.
In R, ho un'operazione che crea alcuni Infvalori quando trasformo un dataframe. Vorrei trasformare questi Infvalori in NAvalori. Il codice che ho è lento per i dati di grandi dimensioni, esiste un modo più veloce per farlo? Diciamo che ho il seguente dataframe: dat <- data.frame(a=c(1, Inf), b=c(Inf, 3), d=c("a","b")) …
101 r  dataframe  data.table 

5
Qual è il modo più veloce per unire / unire data.frames in R?
Ad esempio (non sono sicuro se l'esempio più rappresentativo però): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Questo è quello che ho ottenuto finora: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") …

6
Ottenere i valori migliori per gruppo
Ecco un frame di dati di esempio: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Voglio che il sottoinsieme dcontenga le righe con i primi 5 valori di xper ogni valore di grp. Usando base-R, il mio approccio sarebbe qualcosa del tipo: ordered <- d[order(d$x, decreasing = …
92 r  data.table  dplyr 

4
dplyr su data.table, sto davvero usando data.table?
Se utilizzo la sintassi dplyr sopra un datatable , ottengo tutti i vantaggi in termini di velocità di datatable pur utilizzando la sintassi di dplyr? In altre parole, uso impropriamente il datatable se lo interrogo con la sintassi dplyr? Oppure devo usare la sintassi datatable pura per sfruttare tutta la …
91 r  data.table  dplyr 


5
Suddividi la stringa di testo in colonne data.table
Ho uno script che legge i dati da un file CSV in un data.tablee quindi divide il testo in una colonna in diverse nuove colonne. Attualmente sto usando le funzioni lapplye strsplitper farlo. Ecco un esempio: library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE = 1:6) dt = as.data.table(df) # split …
87 r  data.table 



5
data.table interpolando linearmente i valori NA senza gruppi
Volevo riempire alcuni valori NA in un data.table senza gruppi. Si prega di considerare questo estratto di data.table che rappresenta il tempo e le distanze: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, NA, NA, NA, NA, 31154.19, …
18 r  data.table 





Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.