Converti il ​​tipo di colonna DataFrame da stringa in formato datetime, gg / mm / aaaa


Risposte:


476

Il modo più semplice è usare to_datetime:

df['col'] = pd.to_datetime(df['col'])

Offre anche un dayfirstargomento per i tempi europei (ma attenzione, questo non è severo ).

Eccolo in azione:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

Puoi passare un formato specifico :

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]

grazie per il tuo replay, posso definirne il formato? come "% d /% m /% Y"? molto apprezzato
perigeo

2
@shootingstars magari vedere stackoverflow.com/questions/13703720/...
Andy Hayden

1
@shootingstars che passa l'array DatetimeIndex(df['col']).to_pydatetime()dovrebbe funzionare.
Andy Hayden,

1
Nvm, ho commentato troppo presto. La ricerca di SettingWithCopyWarningmateriale a sufficienza
Sundeep

2
Le doppie parentesi graffe @daneshjai creano un DataFrame (con una sola colonna) rispetto alle parentesi singole che ottengono la colonna come una serie.
Andy Hayden,

36

Se la colonna della tua data è una stringa del formato '01-01-2017' puoi usare l'astype panda per convertirla in datetime.

df['date'] = df['date'].astype('datetime64[ns]')

oppure utilizzare datetime64 [D] se si desidera la precisione del giorno e non i nanosecondi

print(type(df_launath['date'].iloc[0]))

i rendimenti

<class 'pandas._libs.tslib.Timestamp'> lo stesso di quando usi pandas.to_datetime

Puoi provarlo con altri formati, quindi '% Y-% m-% d' ma almeno funziona.



2

Se hai un mix di formati nella tua data, non dimenticare di impostare infer_datetime_format=Trueper semplificarti la vita

df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)

Fonte: pd.to_datetime

o se vuoi un approccio personalizzato:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.