Domande taggate «dplyr»

Usa questo tag per domande relative alle funzioni del pacchetto dplyr, come group_by, summarize, filter e select.

5
Raccogli più set di colonne
Ho i dati di un sondaggio online in cui gli intervistati eseguono un ciclo di domande 1-3 volte. Il software di indagine (Qualtrics) registra questi dati in più colonne, cioè Q3.2 nel sondaggio avrà colonne Q3.2.1., Q3.2.2.e Q3.2.3.: df <- data.frame( id = 1:10, time = as.Date('2009-01-01') + 0:9, Q3.2.1. …
108 r  reshape  dplyr  qualtrics  tidyr 


4
dplyr summarize: equivalente a ".drop = FALSE" per mantenere i gruppi con lunghezza zero in output
Quando si utilizza summarisecon plyrla ddplyfunzione di, le categorie vuote vengono eliminate per impostazione predefinita. Puoi modificare questo comportamento aggiungendo .drop = FALSE. Tuttavia, questo non funziona quando si utilizza summarisecon dplyr. C'è un altro modo per mantenere le categorie vuote nel risultato? Ecco un esempio con dati falsi. library(dplyr) …
97 r  dplyr  plyr  tidyr 

8
R dplyr: rilascia più colonne
Ho un dataframe e un elenco di colonne in quel dataframe che vorrei eliminare. Usiamo il irisset di dati come esempio. Mi piacerebbe far cadere Sepal.Lengthed Sepal.Widthe utilizzare solo le colonne rimanenti. Come posso farlo usando selecto select_dal dplyrpacchetto? Ecco cosa ho provato finora: drop.cols <- c('Sepal.Length', 'Sepal.Width') iris %>% …
96 r  dplyr 


6
Ottenere i valori migliori per gruppo
Ecco un frame di dati di esempio: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Voglio che il sottoinsieme dcontenga le righe con i primi 5 valori di xper ogni valore di grp. Usando base-R, il mio approccio sarebbe qualcosa del tipo: ordered <- d[order(d$x, decreasing = …
92 r  data.table  dplyr 

4
dplyr su data.table, sto davvero usando data.table?
Se utilizzo la sintassi dplyr sopra un datatable , ottengo tutti i vantaggi in termini di velocità di datatable pur utilizzando la sintassi di dplyr? In altre parole, uso impropriamente il datatable se lo interrogo con la sintassi dplyr? Oppure devo usare la sintassi datatable pura per sfruttare tutta la …
91 r  data.table  dplyr 


3
dplyr muta con valori condizionali
In un dataframe di grandi dimensioni ("myfile") con quattro colonne devo aggiungere una quinta colonna con valori basati condizionatamente sulle prime quattro colonne. Preferisci risposte con dplyre mutate, principalmente a causa della sua velocità in set di dati di grandi dimensioni. Il mio dataframe ha questo aspetto: V1 V2 V3 …
88 r  dplyr  mutate 


7
Come sostituire NA con un set di valori
Ho il seguente frame di dati: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Sembra così: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b …
18 r  dplyr  tibble 


1
Come ruotare il frame di dati consistente in colonna con sezione e sottosezione in R
Ho un frame di dati di seguito indicato: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.