Vorrei leggere diversi file CSV da una directory in Panda e concatenarli in un grande DataFrame. Non sono stato in grado di capirlo però. Ecco quello che ho finora:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Immagino di aver bisogno di aiuto all'interno del ciclo for ???
big_frame = pd.concat(dfs, ignore_index=True)?, comunque, una volta che hai un elenco di frame di dati, dovrai scorrere l'elenco e big_frame
dfsora, quindi qualcosa come for df in dfs: big_frame.concat(df, ignore_index=True)dovrebbe funzionare, si potrebbe anche provare appendinvece che concatanche.
concatdovrebbe gestire un elenco di DataFrames proprio come hai fatto tu. Penso che questo sia un ottimo approccio.
dfslista, non vuoi sostituire la lineadata = pd.read_csv(filename)condfs.append(pd.read_csv(filename). Dovresti quindi scorrere l'elenco econcat, non credoconcatche funzionerà su un elenco didfs.