Domande taggate «dataframe»

Un frame di dati è una struttura di dati tabulare. Di solito, contiene dati in cui le righe sono osservazioni e le colonne sono variabili di vario tipo. Mentre "data frame" o "dataframe" è il termine utilizzato per questo concetto in diverse lingue (R, Apache Spark, deedle, Maple, la libreria panda in Python e la libreria DataFrames in Julia), "tabella" è il termine utilizzato in MATLAB e SQL.











7
Qual'è la differenza tra join e merge in Pandas?
Supponiamo che io abbia due DataFrames in questo modo: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Voglio unirli, quindi provo qualcosa del genere: pd.merge(left, right, left_on='key1', right_on='key2') E sono felice key1 lval key2 rval 0 foo 1 foo 4 1 bar …
208 python  pandas  dataframe  join 

7
Panda raggruppati per somma
Sto usando questo frame di dati: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 …

13
Come mostrare il contenuto della colonna completa in un Spark Dataframe?
Sto usando spark-csv per caricare i dati in un DataFrame. Voglio fare una semplice query e visualizzare il contenuto: val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("my.csv") df.registerTempTable("tasks") results = sqlContext.sql("select col from tasks"); results.show() Il col sembra troncato: scala> results.show(); +--------------------+ | col| +--------------------+ |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.