Uso pandas.to_datetime
per analizzare le date nei miei dati. Panda di default rappresenta le date con datetime64[ns]
anche se le date sono tutte solo quotidiane. Mi chiedo se ci sia un modo elegante / intelligente per convertire le date per datetime.date
o datetime64[D]
in modo tale che, quando scrivo i dati in formato CSV, le date non vengono aggiunti con 00:00:00
. So di poter convertire manualmente il tipo elemento per elemento:
[dt.to_datetime().date() for dt in df.dates]
Ma questo è molto lento poiché ho molte righe e sconfigge lo scopo dell'uso pandas.to_datetime
. C'è un modo per convertire dtype
l'intera colonna contemporaneamente? O in alternativa, pandas.to_datetime
supporta una specifica di precisione in modo che io possa liberarmi della parte temporale mentre lavoro con i dati giornalieri?
df.dates.apply(lambda x: x.date())
dovrebbe essere almeno un po 'più veloce. dai un'occhiata anche a github.com/pydata/pandas/issues/2583