Ho i dati di un sondaggio online in cui gli intervistati eseguono un ciclo di domande 1-3 volte. Il software di indagine (Qualtrics) registra questi dati in più colonne, cioè Q3.2 nel sondaggio avrà colonne Q3.2.1., Q3.2.2.e Q3.2.3.: df <- data.frame( id = 1:10, time = as.Date('2009-01-01') + 0:9, Q3.2.1. …
È possibile filtrare un data.frame per casi completi utilizzando dplyr? complete.casescon un elenco di tutte le variabili funziona, ovviamente. Ma questo è a) verboso quando ci sono molte variabili eb) impossibile quando i nomi delle variabili non sono noti (ad esempio in una funzione che elabora qualsiasi data.frame). library(dplyr) df …
Quando si utilizza summarisecon plyrla ddplyfunzione di, le categorie vuote vengono eliminate per impostazione predefinita. Puoi modificare questo comportamento aggiungendo .drop = FALSE. Tuttavia, questo non funziona quando si utilizza summarisecon dplyr. C'è un altro modo per mantenere le categorie vuote nel risultato? Ecco un esempio con dati falsi. library(dplyr) …
Ho un dataframe e un elenco di colonne in quel dataframe che vorrei eliminare. Usiamo il irisset di dati come esempio. Mi piacerebbe far cadere Sepal.Lengthed Sepal.Widthe utilizzare solo le colonne rimanenti. Come posso farlo usando selecto select_dal dplyrpacchetto? Ecco cosa ho provato finora: drop.cols <- c('Sepal.Length', 'Sepal.Width') iris %>% …
Sto tentando di riprodurre uno degli esempi nel pacchetto dplyr ma ricevo questo messaggio di errore. Mi aspetto di vedere una nuova colonna n prodotta con la frequenza di ciascuna combinazione. Cosa mi manca? Ho controllato tre volte che il pacchetto sia caricato. library(dplyr) # summarise peels off a single …
Ecco un frame di dati di esempio: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Voglio che il sottoinsieme dcontenga le righe con i primi 5 valori di xper ogni valore di grp. Usando base-R, il mio approccio sarebbe qualcosa del tipo: ordered <- d[order(d$x, decreasing = …
Se utilizzo la sintassi dplyr sopra un datatable , ottengo tutti i vantaggi in termini di velocità di datatable pur utilizzando la sintassi di dplyr? In altre parole, uso impropriamente il datatable se lo interrogo con la sintassi dplyr? Oppure devo usare la sintassi datatable pura per sfruttare tutta la …
Ho due frame di dati che voglio unire usando dplyr. Uno è un frame di dati contenente i nomi. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) L'altro data frame contiene una versione pulita del corpus dei nomi Kantrowitz, che identifica il sesso. Ecco un esempio …
In un dataframe di grandi dimensioni ("myfile") con quattro colonne devo aggiungere una quinta colonna con valori basati condizionatamente sulle prime quattro colonne. Preferisci risposte con dplyre mutate, principalmente a causa della sua velocità in set di dati di grandi dimensioni. Il mio dataframe ha questo aspetto: V1 V2 V3 …
Sono in procinto di provare un flusso di lavoro basato su dplyr (piuttosto che utilizzare principalmente data.table, a cui sono abituato), e ho riscontrato un problema a cui non riesco a trovare una soluzione dplyr equivalente . Di solito mi imbatto nello scenario in cui ho bisogno di aggiornare / …
Ho il seguente frame di dati: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Sembra così: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b …
Prendi in considerazione una tabella in cui ogni colonna è un vettore di caratteri che può assumere molti valori - diciamo da "A" a "F". library(tidyverse) sample_df <- tibble(q1 = c("A", "B", "C"), q2 = c("B", "B", "A")) Vorrei creare una funzione che prende il nome di una colonna come …
So che ci sono molte domande simili qui intorno, ma nessuna sembra affrontare il problema preciso che sto riscontrando. set.seed(4) df = data.frame( Key = c("A", "B", "A", "D", "A"), Val1 = rnorm(5), Val2 = runif(5), Val3 = 1:5 ) Voglio azzerare i valori delle colonne dei valori per le …
Sto cercando di filtrare la colonna Symbol in base al fatto che sia del modulo \uxxxx Questo è facile visivamente, che è, un po 'come guardare $, ¢, £, e altri come \u058f, \u060b, \u07fe. Ma non riesco a capirlo usando stringi/dplyr library(dplyr) library(stringi) df <- structure(list(Character = c("\\u0024", "\\u00A2", …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.