Sto provando a usare i panda per manipolare un file .csv ma ottengo questo errore:
pandas.parser.CParserError: errore nella tokenizzazione dei dati. Errore C: previsti 2 campi nella riga 3, visto 12
Ho provato a leggere i documenti di Panda, ma non ho trovato nulla.
Il mio codice è semplice:
path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)
Come posso risolvere questo? Dovrei usare il csv
modulo o un'altra lingua?
Il file proviene da Morningstar
pd.read_csv("<path>", sep=";")
. Non utilizzare Excel per il controllo poiché a volte inserisce i dati in colonne per impostazione predefinita e quindi rimuove il separatore.
pandas.to_csv()
, POTREBBE essere perché c'è un '\ r' nei nomi di una colonna, nel qual caso to_csv () scriverà effettivamente i nomi delle colonne successive nella prima colonna del frame di dati, causando una differenza tra il numero di colonne nelle prime X righe. Questa differenza è una delle cause dell'errore C.