Comment construire un objet timedelta à partir d'une simple chaîne

96

J'écris une fonction qui a besoin d'une entrée timedelta à transmettre sous forme de chaîne. L'utilisateur doit entrer quelque chose comme "32m" ou "2h32m", ou même "4:13" ou "5hr34m56s" ... Y a-t-il une bibliothèque ou quelque chose qui a déjà implémenté ce genre de chose?

prêtre
la source
Pour des gens qui cherchent à construire un objet timedelta de djours, hheures, mminutes et ssecondes à l' aide d' une ligne (après l' importation datetime): datetime.timedelta(days = d, hours = h, minutes=m, seconds=s).
zthomas.nc

Réponses:

72

Pour le premier format (5hr34m56s), vous devez analyser à l'aide d'expressions régulières

Voici la solution re-basée:

import re
from datetime import timedelta


regex = re.compile(r'((?P<hours>\d+?)hr)?((?P<minutes>\d+?)m)?((?P<seconds>\d+?)s)?')


def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    time_params = {}
    for (name, param) in parts.iteritems():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)


>>> from parse_time import parse_time
>>> parse_time('12hr')
datetime.timedelta(0, 43200)
>>> parse_time('12hr5m10s')
datetime.timedelta(0, 43510)
>>> parse_time('12hr10s')
datetime.timedelta(0, 43210)
>>> parse_time('10s')
datetime.timedelta(0, 10)
>>> 
virhilo
la source
4
Je pensais à une sorte de fonction qui pourrait prendre tout ce que vous lui lancez tout en étant capable de gérer la conversion en timedelta.
Priestc
2
J'ai ajouté un exemple de solution basée sur :)
virhilo
4
Je ne vois pas comment dateutil.parser.parse peut analyser les durées, il semble qu'il renvoie toujours une date / heure. Qu'est-ce que je rate?
Nickolay
7
dateutil.parser.parsen'analysera pas les timedeltaobjets. Il renvoie a datetimeet déclenche une exception pour des chaînes comme '28:32:11.10'.
Spak
95

Pour moi, la solution la plus élégante, sans avoir à recourir à des bibliothèques externes telles que dateutil ou à analyser manuellement l'entrée, est d'utiliser la puissante strptimeméthode d'analyse de chaînes de datetime .

from datetime import datetime, timedelta
# we specify the input and the format...
t = datetime.strptime("05:20:25","%H:%M:%S")
# ...and use datetime's hour, min and sec properties to build a timedelta
delta = timedelta(hours=t.hour, minutes=t.minute, seconds=t.second)

Après cela, vous pouvez utiliser votre objet timedelta comme d'habitude, le convertir en secondes pour vous assurer que nous avons fait la bonne chose, etc.

print(delta)
assert(5*60*60+20*60+25 == delta.total_seconds())
metakermit
la source
33
Notez que cette approche ne fonctionne que si la durée est inférieure à 24 heures ( datetime.strptime("32:20:25","%H:%M:%S")ne fonctionne pas) et que vous devez connaître le format d'entrée exact.
verdesmarald
Cela ne répond également qu'en partie à la question du PO. Si la fonction doit gérer plusieurs formats, vous avez toujours besoin d'une inspection de format supplémentaire (1 deux points ou 2?).
Danny Staple
3
@verdesmarald Donc, à partir de python 3.5, existe-t-il une solution élégante sans utiliser de bibliothèques externes et sans supposer que la durée est inférieure à 24 heures?
max
1
Je trouve la nécessité de spécifier manuellement les paramètres nommés pour le timedeltaparamètre assez ennuyeux, mais le mieux que je puisse trouver pour éviter cela est:, ce delta = t - datetime.combine(t.date(), time.min)qui est ... horrible.
Kyle Strand
2
Un problème sérieux avec cette approche est que si vous incluez des jours, l'envoi de% d dans strptime ne vous permettra pas de saisir le jour 0, car seuls les jours de> = 1 sont valides pour une date.
user1581390
75

J'ai eu un peu de temps hier, alors j'ai développé la réponse de @virhilo dans un module Python, en ajoutant quelques formats d'expression de temps supplémentaires, y compris tous ceux demandés par @priestc .

Le code source est sur github (licence MIT) pour quiconque le souhaite. C'est aussi sur PyPI:

pip install pytimeparse

Renvoie l'heure en nombre de secondes:

>>> from pytimeparse.timeparse import timeparse
>>> timeparse('32m')
1920
>>> timeparse('2h32m')
9120
>>> timeparse('4:13')
253
>>> timeparse('5hr34m56s')
20096
>>> timeparse('1.2 minutes')
72
Wildwilhelm
la source
existe-t-il un équivalent Java / Scala?
luca.giovagnoli
Impressionnant! Merci beaucoup
Bouncner
@ luca.giovagnoli Dans Scala, vous pouvez utiliser la classe Duration. La durée peut être construite à partir de chaînes telles que «15 secondes», «4 minutes», etc.
Konrad Malik
14

Je voulais entrer juste une heure, puis l'ajouter à différentes dates, donc cela a fonctionné pour moi:

from datetime import datetime as dtt

time_only = dtt.strptime('15:30', "%H:%M") - dtt.strptime("00:00", "%H:%M")
kztd
la source
dtt.strptime(myduration, "%H:%M:%S") - dtt(1900, 1, 1)fonctionne aussi ...
576i
8

J'ai modifié la belle réponse de virhilo avec quelques mises à jour:

  • ajouté une assertion selon laquelle la chaîne est une chaîne d'heure valide
  • remplacer l'indicateur des heures "hr" par "h"
  • prévoir un indicateur "d" - jours
  • autoriser des temps non entiers (par exemple, 3m0.25s3 minutes, 0,25 seconde)

.

import re
from datetime import timedelta


regex = re.compile(r'^((?P<days>[\.\d]+?)d)?((?P<hours>[\.\d]+?)h)?((?P<minutes>[\.\d]+?)m)?((?P<seconds>[\.\d]+?)s)?$')


def parse_time(time_str):
    """
    Parse a time string e.g. (2h13m) into a timedelta object.

    Modified from virhilo's answer at https://stackoverflow.com/a/4628148/851699

    :param time_str: A string identifying a duration.  (eg. 2h13m)
    :return datetime.timedelta: A datetime.timedelta object
    """
    parts = regex.match(time_str)
    assert parts is not None, "Could not parse any time information from '{}'.  Examples of valid strings: '8h', '2d8h5m20s', '2m4s'".format(time_str)
    time_params = {name: float(param) for name, param in parts.groupdict().items() if param}
    return timedelta(**time_params)
Peter
la source
1
Génial! J'ai ajouté "*" entre les éléments pour autoriser également "1d 3h 5m"
Marcel Waldvogel
@MarcelWaldvogel sympa, si vous copiez le texte de la nouvelle regex, j'ajouterai votre réponse dans
Peter
@virhilo et Peter: Ma légère évolution sur votre code est ici: github.com/zeitgitter/zeitgitterd/blob/master/zeitgitter/… . Je suppose que vous pouvez utiliser votre code. Avez-vous des préférences pour la licence? MIT, Apache, GPL,…?
Marcel Waldvogel le
1
Marcel, pouvez-vous m'envoyer votre adresse pour que je puisse poursuivre? JK allez-y toute licence est bien.
Peter le
Voici le nouveau Regex; la différence est le "*" s: regex = re.compile (r '^ ((? P <days> [\. \ d] +?) d)? *' r '((? P <hours> [\ . \ d] +?) h)? * 'r' ((? P <minutes> [\. \ d] +?) m)? * 'r' ((? P <secondes> [\. \ d] +?) s)? $ ')
Marcel Waldvogel
3

Si vous utilisez Python 3, voici la version mise à jour de la solution de Hari Shankar, que j'ai utilisée:

from datetime import timedelta
import re

regex = re.compile(r'(?P<hours>\d+?)/'
                   r'(?P<minutes>\d+?)/'
                   r'(?P<seconds>\d+?)$')

def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    print(parts)
    time_params = {}
    for name, param in parts.items():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)
Alexey Kislitsin
la source
3

Django est livré avec la fonction utilitaire parse_duration(). De la documentation :

Analyse une chaîne et renvoie un datetime.timedelta.

Attend des données au format "DD HH:MM:SS.uuuuuu"ou tel que spécifié par ISO 8601 (par exemple, P4DT1H15M20Sce qui équivaut à 4 1:15:20) ou au format d'intervalle jour-heure de PostgreSQL (par exemple 3 days 04:05:06).

Don Kirkby
la source