Comment convertir une colonne de chaînes DataFrame (dans format jj / mm / aaaa ) en heures?
284
Comment convertir une colonne de chaînes DataFrame (dans format jj / mm / aaaa ) en heures?
La façon la plus simple est d'utiliser to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Il offre également un dayfirst
argument pour les temps européens (mais attention ce n'est pas strict ).
Le voici en action:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Vous pouvez passer un format spécifique :
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
DatetimeIndex(df['col']).to_pydatetime()
devrait fonctionner.SettingWithCopyWarning
donne suffisamment de matérielSi votre colonne de date est une chaîne au format '01-01-2017', vous pouvez utiliser un type pandas pour le convertir en datetime.
df['date'] = df['date'].astype('datetime64[ns]')
ou utilisez datetime64 [D] si vous voulez une précision de jour et non des nanosecondes
print(type(df_launath['date'].iloc[0]))
les rendements
<class 'pandas._libs.tslib.Timestamp'>
comme lorsque vous utilisez pandas.to_datetimeVous pouvez l'essayer avec d'autres formats que '% Y-% m-% d' mais au moins cela fonctionne.
la source
Vous pouvez utiliser les éléments suivants si vous souhaitez spécifier des formats délicats:
Plus de détails
format
ici:la source
Si vous avez un mélange de formats dans votre date, n'oubliez pas de régler
infer_datetime_format=True
pour vous faciliter la viedf['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Source: pd.to_datetime
ou si vous souhaitez une approche personnalisée:
la source