Il pacchetto R data.table è un'estensione di data.frame creata per un'analisi rapida dei dati in memoria. Usa il tag dt per il pacchetto DataTables con Shiny (DT).
Ho un problema con data.table: come posso convertire le classi di colonne? Ecco un semplice esempio: con data.frame non ho problemi a convertirlo, con data.table non so proprio come: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way df[, "value"] <- …
Sto usando data.table e ci sono molte funzioni che richiedono di impostare una chiave (ad esempio X[Y]). Come tale, desidero capire cosa fa una chiave per impostare correttamente le chiavi nelle mie tabelle di dati. Una fonte che ho letto è stata ?setkey. setkey()ordina un data.tablee lo contrassegna come ordinato. …
In R, ho un'operazione che crea alcuni Infvalori quando trasformo un dataframe. Vorrei trasformare questi Infvalori in NAvalori. Il codice che ho è lento per i dati di grandi dimensioni, esiste un modo più veloce per farlo? Diciamo che ho il seguente dataframe: dat <- data.frame(a=c(1, Inf), b=c(Inf, 3), d=c("a","b")) …
Ad esempio (non sono sicuro se l'esempio più rappresentativo però): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Questo è quello che ho ottenuto finora: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") …
Ecco un frame di dati di esempio: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Voglio che il sottoinsieme dcontenga le righe con i primi 5 valori di xper ogni valore di grp. Usando base-R, il mio approccio sarebbe qualcosa del tipo: ordered <- d[order(d$x, decreasing = …
Se utilizzo la sintassi dplyr sopra un datatable , ottengo tutti i vantaggi in termini di velocità di datatable pur utilizzando la sintassi di dplyr? In altre parole, uso impropriamente il datatable se lo interrogo con la sintassi dplyr? Oppure devo usare la sintassi datatable pura per sfruttare tutta la …
data.tablegli oggetti ora hanno un operatore: =. Cosa rende questo operatore diverso da tutti gli altri operatori di assegnazione? Inoltre, quali sono i suoi usi, quanto è più veloce e quando dovrebbe essere evitato?
Ho uno script che legge i dati da un file CSV in un data.tablee quindi divide il testo in una colonna in diverse nuove colonne. Attualmente sto usando le funzioni lapplye strsplitper farlo. Ecco un esempio: library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE = 1:6) dt = as.data.table(df) # split …
Ho un data.table con cui vorrei eseguire la stessa operazione su determinate colonne. I nomi di queste colonne sono forniti in un vettore di caratteri. In questo particolare esempio, vorrei moltiplicare tutte queste colonne per -1. Alcuni dati sui giocattoli e un vettore che specifica le colonne pertinenti: library(data.table) dt …
Sono in procinto di provare un flusso di lavoro basato su dplyr (piuttosto che utilizzare principalmente data.table, a cui sono abituato), e ho riscontrato un problema a cui non riesco a trovare una soluzione dplyr equivalente . Di solito mi imbatto nello scenario in cui ho bisogno di aggiornare / …
Volevo riempire alcuni valori NA in un data.table senza gruppi. Si prega di considerare questo estratto di data.table che rappresenta il tempo e le distanze: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, NA, NA, NA, NA, 31154.19, …
Ho un data.table : groups <- data.table(group = c("A", "B", "C", "D", "E", "F", "G"), code_1 = c(2,2,2,7,8,NA,5), code_2 = c(NA,3,NA,3,NA,NA,2), code_3 = c(4,1,1,4,4,1,8)) group code_1 code_2 code_3 A 2 NA 4 B 2 3 1 C 2 NA 1 D 7 3 4 E 8 NA 4 F NA …
Ho l'abitudine di raggruppare compiti simili in un'unica linea. Ad esempio, se devo filtrare su a, be cin una tabella di dati, li metterò insieme in uno []con AND. Ieri, ho notato che nel mio caso particolare questo è stato incredibilmente lento e testato invece i filtri di concatenamento. Ho …
Devo dividere una colonna che contiene informazioni in più colonne. Vorrei usare tstrsplitma lo stesso tipo di informazioni non è nello stesso ordine tra le righe e devo estrarre il nome della nuova colonna all'interno della variabile. Importante da sapere: possono esserci molte informazioni (campi per diventare nuove variabili) e …
So che ci sono molte domande simili qui intorno, ma nessuna sembra affrontare il problema preciso che sto riscontrando. set.seed(4) df = data.frame( Key = c("A", "B", "A", "D", "A"), Val1 = rnorm(5), Val2 = runif(5), Val3 = 1:5 ) Voglio azzerare i valori delle colonne dei valori per le …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.