Domande taggate «dataframe»

Un frame di dati è una struttura di dati tabulare. Di solito, contiene dati in cui le righe sono osservazioni e le colonne sono variabili di vario tipo. Mentre "data frame" o "dataframe" è il termine utilizzato per questo concetto in diverse lingue (R, Apache Spark, deedle, Maple, la libreria panda in Python e la libreria DataFrames in Julia), "tabella" è il termine utilizzato in MATLAB e SQL.


11
Come eliminare le colonne per nome in un frame di dati
Ho un set di dati di grandi dimensioni e vorrei leggere colonne specifiche o eliminare tutte le altre. data <- read.dta("file.dta") Seleziono le colonne che non mi interessano: var.out <- names(data)[!names(data) %in% c("iden", "name", "x_serv", "m_serv")] e poi mi piacerebbe fare qualcosa del tipo: for(i in 1:length(var.out)) { paste("data$", var.out[i], …
304 r  dataframe  subset 

15
Converti Python dict in un dataframe
Ho un dizionario Python come il seguente: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06-29': …
299 python  pandas  dataframe 


11
Come accedere all'ultimo valore in un vettore?
Supponiamo di avere un vettore nidificato in un frame di dati di uno o due livelli. Esiste un modo rapido e sporco per accedere all'ultimo valore, senza utilizzare la length()funzione? Qualcosa di $#speciale alla var di PERL ? Quindi vorrei qualcosa come: dat$vec1$vec2[$#] invece di dat$vec1$vec2[length(dat$vec1$vec2)]
290 r  dataframe  vector 



3
Come verificare se esiste una colonna in Panda
C'è un modo per verificare se esiste una colonna in un DataFrame Pandas? Supponiamo che io abbia il seguente DataFrame: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 …
274 python  pandas  dataframe 

21
Che cosa significa axis in panda?
Ecco il mio codice per generare un frame di dati: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) poi ho ottenuto il frame di dati: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ Quando scrivo il comando: dff.mean(axis=1) Ho ottenuto : …

6
Rimuovi un'intera colonna da un data.frame in R
Qualcuno sa come rimuovere un'intera colonna da un data.frame in R? Ad esempio se mi viene dato questo data.frame: > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon e voglio …
267 r  dataframe 

10
Come prendere sezioni di colonne di frame di dati in Panda
Carico alcuni dati di apprendimento automatico da un file CSV. Le prime 2 colonne sono osservazioni e le restanti colonne sono caratteristiche. Attualmente, faccio quanto segue: data = pandas.read_csv('mydata.csv') che dà qualcosa del tipo: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) Mi piacerebbe tagliare questo dataframe in due dataframes: uno contenente …



9
Unisci contemporaneamente più data.frames in un elenco
Ho un elenco di molti data.frames che voglio unire. Il problema qui è che ogni data.frame differisce in termini di numero di righe e colonne, ma condividono tutte le variabili chiave (che ho chiamato "var1"e "var2"nel codice seguente). Se i data.frames fossero identici in termini di colonne, potrei semplicemente rbind, …
259 r  list  merge  dataframe  r-faq 


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.