Programmazione dplyr

5

Ho i dati di un sondaggio online in cui gli intervistati eseguono un ciclo di domande 1-3 volte. Il software di indagine (Qualtrics) registra questi dati in più colonne, cioè Q3.2 nel sondaggio avrà colonne Q3.2.1., Q3.2.2.e Q3.2.3.: df <- data.frame( id = 1:10, time = as.Date('2009-01-01') + 0:9, Q3.2.1. …

108 r reshape dplyr qualtrics tidyr

6

filtro per casi completi in data.frame utilizzando dplyr (eliminazione in base al caso)

È possibile filtrare un data.frame per casi completi utilizzando dplyr? complete.casescon un elenco di tutte le variabili funziona, ovviamente. Ma questo è a) verboso quando ci sono molte variabili eb) impossibile quando i nomi delle variabili non sono noti (ad esempio in una funzione che elabora qualsiasi data.frame). library(dplyr) df …

97 r dplyr magrittr

4

dplyr summarize: equivalente a ".drop = FALSE" per mantenere i gruppi con lunghezza zero in output

Quando si utilizza summarisecon plyrla ddplyfunzione di, le categorie vuote vengono eliminate per impostazione predefinita. Puoi modificare questo comportamento aggiungendo .drop = FALSE. Tuttavia, questo non funziona quando si utilizza summarisecon dplyr. C'è un altro modo per mantenere le categorie vuote nel risultato? Ecco un esempio con dati falsi. library(dplyr) …

97 r dplyr plyr tidyr

8

R dplyr: rilascia più colonne

Ho un dataframe e un elenco di colonne in quel dataframe che vorrei eliminare. Usiamo il irisset di dati come esempio. Mi piacerebbe far cadere Sepal.Lengthed Sepal.Widthe utilizzare solo le colonne rimanenti. Come posso farlo usando selecto select_dal dplyrpacchetto? Ecco cosa ho provato finora: drop.cols <- c('Sepal.Length', 'Sepal.Width') iris %>% …

96 r dplyr

6

dplyr: "Errore in n (): la funzione non deve essere chiamata direttamente"

Sto tentando di riprodurre uno degli esempi nel pacchetto dplyr ma ricevo questo messaggio di errore. Mi aspetto di vedere una nuova colonna n prodotta con la frequenza di ciascuna combinazione. Cosa mi manca? Ho controllato tre volte che il pacchetto sia caricato. library(dplyr) # summarise peels off a single …

96 r function plyr dplyr conflicting-libraries

6

Ottenere i valori migliori per gruppo

Ecco un frame di dati di esempio: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Voglio che il sottoinsieme dcontenga le righe con i primi 5 valori di xper ogni valore di grp. Usando base-R, il mio approccio sarebbe qualcosa del tipo: ordered <- d[order(d$x, decreasing = …

92 r data.table dplyr

4

dplyr su data.table, sto davvero usando data.table?

Se utilizzo la sintassi dplyr sopra un datatable , ottengo tutti i vantaggi in termini di velocità di datatable pur utilizzando la sintassi di dplyr? In altre parole, uso impropriamente il datatable se lo interrogo con la sintassi dplyr? Oppure devo usare la sintassi datatable pura per sfruttare tutta la …

91 r data.table dplyr

2

Come specificare i nomi delle colonne per xey quando ci si unisce in dplyr?

Ho due frame di dati che voglio unire usando dplyr. Uno è un frame di dati contenente i nomi. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) L'altro data frame contiene una versione pulita del corpus dei nomi Kantrowitz, che identifica il sesso. Ecco un esempio …

91 r join left-join dplyr

3

dplyr muta con valori condizionali

In un dataframe di grandi dimensioni ("myfile") con quattro colonne devo aggiungere una quinta colonna con valori basati condizionatamente sulle prime quattro colonne. Preferisci risposte con dplyre mutate, principalmente a causa della sua velocità in set di dati di grandi dimensioni. Il mio dataframe ha questo aspetto: V1 V2 V3 …

88 r dplyr mutate

12

dplyr muta / sostituisce diverse colonne su un sottoinsieme di righe

Sono in procinto di provare un flusso di lavoro basato su dplyr (piuttosto che utilizzare principalmente data.table, a cui sono abituato), e ho riscontrato un problema a cui non riesco a trovare una soluzione dplyr equivalente . Di solito mi imbatto nello scenario in cui ho bisogno di aggiornare / …

86 r data.table dplyr

7

Come sostituire NA con un set di valori

Ho il seguente frame di dati: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Sembra così: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b …

18 r dplyr tibble

3

Uso di una valutazione non standard basata su tidyeval nella ricodifica nella parte destra del mutato

Prendi in considerazione una tabella in cui ogni colonna è un vettore di caratteri che può assumere molti valori - diciamo da "A" a "F". library(tidyverse) sample_df <- tibble(q1 = c("A", "B", "C"), q2 = c("B", "B", "A")) Vorrei creare una funzione che prende il nome di una colonna come …

13 r dplyr rlang tidyeval nse

1

Come ruotare il frame di dati consistente in colonna con sezione e sottosezione in R

Ho un frame di dati di seguito indicato: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", …

12 r dataframe dplyr tidyverse tidyr

1

Mutazione dinamica di più colonne durante il condizionamento su righe specifiche

So che ci sono molte domande simili qui intorno, ma nessuna sembra affrontare il problema preciso che sto riscontrando. set.seed(4) df = data.frame( Key = c("A", "B", "A", "D", "A"), Val1 = rnorm(5), Val2 = runif(5), Val3 = 1:5 ) Voglio azzerare i valori delle colonne dei valori per le …

11 r dplyr data.table

2

condizione del filtro dplyr per distinguere tra il simbolo Unicode e la sua rappresentazione Unicode

Sto cercando di filtrare la colonna Symbol in base al fatto che sia del modulo \uxxxx Questo è facile visivamente, che è, un po 'come guardare $, ¢, £, e altri come \u058f, \u060b, \u07fe. Ma non riesco a capirlo usando stringi/dplyr library(dplyr) library(stringi) df <- structure(list(Character = c("\\u0024", "\\u00A2", …

10 r dplyr stringr stringi

Domande taggate «dplyr»