dal documento panda http://pandas.pydata.org/pandas-docs/stable/dsintro.html La
serie è un array con etichetta unidimensionale in grado di contenere qualsiasi tipo di dati. Per leggere i dati in forma di serie di panda:
import pandas as pd
ds = pd.Series(data, index=index)
DataFrame è una struttura di dati con etichetta bidimensionale con colonne di tipi potenzialmente diversi.
import pandas as pd
df = pd.DataFrame(data, index=index)
In entrambi gli indici sopra è riportato l'elenco
ad esempio: ho un file CSV con i seguenti dati:
,country,popuplation,area,capital
BR,Brazil,10210,12015,Brasile
RU,Russia,1025,457,Moscow
IN,India,10458,457787,New Delhi
Per leggere i dati sopra come serie e frame di dati:
import pandas as pd
file_data = pd.read_csv("file_path", index_col=0)
d = pd.Series(file_data.country, index=['BR','RU','IN'] or index = file_data.index)
produzione:
>>> d
BR Brazil
RU Russia
IN India
df = pd.DataFrame(file_data.area, index=['BR','RU','IN'] or index = file_data.index )
produzione:
>>> df
area
BR 12015
RU 457
IN 457787