Sto usando la libreria panda per leggere alcuni dati CSV. Nei miei dati, alcune colonne contengono stringhe. La stringa "nan"
è un valore possibile, così come una stringa vuota. Sono riuscito a convincere i panda a leggere "nan" come una stringa, ma non riesco a capire come fare in modo che non legga un valore vuoto come NaN. Ecco i dati di esempio e l'output
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
Legge correttamente "nan" come stringa "nan", ma legge ancora le celle vuote come NaN Ho provato a passare str
l' converters
argomento a read_csv (con converters={'One': str})
), ma legge ancora le celle vuote come NaN.
Mi rendo conto di poter riempire i valori dopo aver letto, con fillna, ma non c'è davvero modo di dire ai panda che una cella vuota in una particolare colonna CSV dovrebbe essere letta come una stringa vuota invece di NaN?
keep_default_na
seguito.