Vorrei leggere diversi file CSV da una directory in Panda e concatenarli in un grande DataFrame. Non sono stato in grado di capirlo però. Ecco quello che ho finora:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Immagino di aver bisogno di aiuto all'interno del ciclo for ???
big_frame = pd.concat(dfs, ignore_index=True)
?, comunque, una volta che hai un elenco di frame di dati, dovrai scorrere l'elenco e big_frame
dfs
ora, quindi qualcosa come for df in dfs: big_frame.concat(df, ignore_index=True)
dovrebbe funzionare, si potrebbe anche provare append
invece che concat
anche.
concat
dovrebbe gestire un elenco di DataFrames proprio come hai fatto tu. Penso che questo sia un ottimo approccio.
dfs
lista, non vuoi sostituire la lineadata = pd.read_csv(filename)
condfs.append(pd.read_csv(filename)
. Dovresti quindi scorrere l'elenco econcat
, non credoconcat
che funzionerà su un elenco didf
s.