Convertir le type de colonne DataFrame de la chaîne au format datetime, jj / mm / aaaa

Réponses:

476

La façon la plus simple est d'utiliser to_datetime:

df['col'] = pd.to_datetime(df['col'])

Il offre également un dayfirstargument pour les temps européens (mais attention ce n'est pas strict ).

Le voici en action:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

Vous pouvez passer un format spécifique :

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]
Andy Hayden
la source
merci pour votre replay, puis-je définir son format? comme '% d /% m /% Y'? très apprécié
périgée
2
@shootingstars peut-être voir stackoverflow.com/questions/13703720/…
Andy Hayden
1
@shootingstars passant le tableau DatetimeIndex(df['col']).to_pydatetime()devrait fonctionner.
Andy Hayden
1
Nvm, j'ai commenté trop tôt. La recherche de SettingWithCopyWarningdonne suffisamment de matériel
Sundeep
2
@daneshjai double-braces fait un DataFrame (avec une seule colonne) par rapport aux single-braces qui obtient la colonne en tant que Series.
Andy Hayden
36

Si votre colonne de date est une chaîne au format '01-01-2017', vous pouvez utiliser un type pandas pour le convertir en datetime.

df['date'] = df['date'].astype('datetime64[ns]')

ou utilisez datetime64 [D] si vous voulez une précision de jour et non des nanosecondes

print(type(df_launath['date'].iloc[0]))

les rendements

<class 'pandas._libs.tslib.Timestamp'> comme lorsque vous utilisez pandas.to_datetime

Vous pouvez l'essayer avec d'autres formats que '% Y-% m-% d' mais au moins cela fonctionne.

sigurdb
la source
2

Si vous avez un mélange de formats dans votre date, n'oubliez pas de régler infer_datetime_format=Truepour vous faciliter la vie

df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)

Source: pd.to_datetime

ou si vous souhaitez une approche personnalisée:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)
abhyudayasrinet
la source