Panoramica Conosco relativamente data.tablepoco, non tanto dplyr. Ho letto alcune dplyrvignette ed esempi che sono emersi su SO, e finora le mie conclusioni sono che: data.tablee dplyrsono comparabili in termini di velocità, tranne quando ci sono molti gruppi (cioè> 10-100 K) e in alcune altre circostanze (vedere i benchmark di …
tibble(in precedenza tbl_df) è una versione di un frame di dati creato dal dplyrpacchetto di manipolazione del frame di dati in R. Previene l'output di tabelle lunghe quando si chiama accidentalmente il frame di dati. Una volta che un frame di dati è stato racchiuso da tibble/ tbl_df, esiste un …
Devo filtrare un frame di dati usando come criterio quelle righe in cui è contenuta la stringa RTB. Sto usando dplyr. d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(desc(MonthDelivery)) So che posso utilizzare la funzione filterin dplyr, ma io non esattamente come dire che per verificare il …
La mutazione può essere utilizzata quando la mutazione è condizionata (a seconda dei valori di determinati valori di colonna)? Questo esempio aiuta a mostrare cosa intendo. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, …
Esiste un modo più conciso per ottenere una colonna di un dplyr tbl come vettore, da un tbl con back-end del database (ovvero il frame / tabella di dati non può essere direttamente un sottoinsieme)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) iris2$Species # NULL Sarebbe …
Ho un persistente avviso multiplo di "colonna sconosciuta" per tutti i tipi di comandi (ad esempio, str (x) per l'installazione di aggiornamenti sui pacchetti) e non sono sicuro di come eseguire il debug di questo o risolverlo. L'avvertimento "colonna sconosciuta" è chiaramente correlato a una variabile in un tbl_df che …
Voglio usare dplyr::mutate() per creare più nuove colonne in un frame di dati. I nomi delle colonne e il loro contenuto dovrebbero essere generati dinamicamente. Dati di esempio dall'iride: library(dplyr) iris <- tbl_df(iris) Ho creato una funzione per mutare le mie nuove colonne dalla Petal.Widthvariabile: multipetal <- function(df, n) { …
Sto cercando di trasferire la mia comprensione di plyr in dplyr, ma non riesco a capire come raggruppare per più colonne. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) …
Supponiamo che io voglia calcolare la proporzione di valori diversi all'interno di ciascun gruppo. Ad esempio, utilizzando i mtcarsdati, come posso calcolare la frequenza relativa del numero di marce per am (automatica / manuale) in una volta sola dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, …
Domanda Utilizzando dplyr, come faccio a selezionare le osservazioni / righe superiore e inferiore dei dati raggruppati in un'istruzione? Dati ed esempio Dato un frame di dati df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Posso ottenere le osservazioni in alto e in basso da ciascun gruppo usando slice , ma usando due …
Quando lavoro con plyrho trovato spesso utile utilizzare adplyper le funzioni scalari che devo applicare a ogni riga. per esempio data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 …
Ho visto l'uso della funzione %>%(percentuale maggiore della percentuale) in alcuni pacchetti come dplyr e rvest . Cosa significa? È un modo per scrivere blocchi di chiusura in R?
Mi piace la funzione di ridenominazione di plyr rename. Recentemente ho iniziato a utilizzare dplyr e mi chiedevo se esiste un modo semplice per rinominare le variabili utilizzando una funzione di dplyr, che è facile da usare come quella di plyr rename?
Mi rendo conto che la dplyrv3.0 ti permette di unirti su diverse variabili: left_join(x, y, by = c("a" = "b")corrisponderà x.aay.b Tuttavia, è possibile unire una combinazione di variabili o devo aggiungere prima una chiave composta? Qualcosa come questo: left_join(x, y, by = c("a c" = "b d")per abbinare la …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.