Domande taggate «dataframe»

Un frame di dati è una struttura di dati tabulare. Di solito, contiene dati in cui le righe sono osservazioni e le colonne sono variabili di vario tipo. Mentre "data frame" o "dataframe" è il termine utilizzato per questo concetto in diverse lingue (R, Apache Spark, deedle, Maple, la libreria panda in Python e la libreria DataFrames in Julia), "tabella" è il termine utilizzato in MATLAB e SQL.


8
Panda valori univoci più colonne
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Qual è il modo migliore per restituire i valori univoci di "Col1" e "Col2"? L'output desiderato è 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

4
Panda Python: riempie un frame di dati riga per riga
Il semplice compito di aggiungere una riga a un pandas.DataFrameoggetto sembra essere difficile da realizzare. Ci sono 3 domande stackoverflow relative a questo, nessuna delle quali fornisce una risposta funzionante. Ecco cosa sto cercando di fare. Ho un DataFrame di cui conosco già la forma, nonché i nomi delle righe …
133 python  dataframe  row  pandas 


8
Ometti le righe contenenti una colonna specifica di NA
Voglio sapere come omettere i NAvalori in un frame di dati, ma solo in alcune colonne che mi interessano. Per esempio, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) ma voglio solo di omettere i dati dove yè NA, quindi, il risultato dovrebbe …
130 r  dataframe  na 



5
R - Concatenare due frame di dati?
Dati due frame di dati ae b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570 1.7916780 4 -1.3645337 1.3642276 5 -0.4954542 …

10
Come si può aggiungere una riga a un frame di dati in R?
In R, come si aggiunge una nuova riga a un frame di dati una volta che il frame di dati è già stato inizializzato? Finora ho questo: df <- data.frame("hi", "bye") names(df) <- c("hello", "goodbye") #I am trying to add "hola" and "ciao" as a new row de <- data.frame("hola", …
129 r  dataframe 

9
Come si aggiunge una nuova colonna a un Spark DataFrame (utilizzando PySpark)?
Ho uno Spark DataFrame (utilizzando PySpark 1.5.1) e vorrei aggiungere una nuova colonna. Ho provato quanto segue senza alcun successo: type(randomed_hours) # => list # Create in Python and transform to RDD new_col = pd.DataFrame(randomed_hours, columns=['new_col']) spark_new_col = sqlContext.createDataFrame(new_col) my_df_spark.withColumn("hours", spark_new_col["new_col"]) Ho anche ricevuto un errore usando questo: my_df_spark.withColumn("hours", sc.parallelize(randomed_hours)) …

4
Concatena un elenco di frame di dati panda insieme
Ho un elenco di dataframe Pandas che vorrei combinare in un dataframe Pandas. Sto usando Python 2.7.10 e Pandas 0.16.2 Ho creato l'elenco dei dataframe da: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , cnxn, chunksize=10000): dfs.append(chunk) Ciò restituisce un …


5
Aggiungi le date mancanti al dataframe dei panda
I miei dati possono avere più eventi in una determinata data o NESSUN evento in una data. Prendo questi eventi, faccio un conteggio per data e li pianifico. Tuttavia, quando li trama, le mie due serie non sempre corrispondono. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() Nel codice sopra idx …
128 python  date  plot  pandas  dataframe 



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.