Come costruire un oggetto timedelta da una semplice stringa


96

Sto scrivendo una funzione che necessita di un input timedelta da passare come stringa. L'utente deve inserire qualcosa come "32m" o "2h32m", o anche "4:13" o "5hr34m56s" ... C'è una libreria o qualcosa che ha già implementato questo genere di cose?


Per le persone solo cercando di costruire un oggetto timedelta di dgiorni, hore, mminuti e ssecondi utilizzando una linea (dopo l'importazione datetime): datetime.timedelta(days = d, hours = h, minutes=m, seconds=s).
zthomas.nc

Risposte:


72

Per il primo formato (5hr34m56s), dovresti analizzare usando espressioni regolari

Ecco la soluzione re-based:

import re
from datetime import timedelta


regex = re.compile(r'((?P<hours>\d+?)hr)?((?P<minutes>\d+?)m)?((?P<seconds>\d+?)s)?')


def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    time_params = {}
    for (name, param) in parts.iteritems():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)


>>> from parse_time import parse_time
>>> parse_time('12hr')
datetime.timedelta(0, 43200)
>>> parse_time('12hr5m10s')
datetime.timedelta(0, 43510)
>>> parse_time('12hr10s')
datetime.timedelta(0, 43210)
>>> parse_time('10s')
datetime.timedelta(0, 10)
>>> 

4
Stavo pensando a un qualche tipo di funzione che potrebbe prendere qualsiasi cosa tu gli lanci ed essere ancora in grado di gestire la conversione in timedelta.
priestc

2
Ho aggiunto un esempio di soluzione basata su re :)
virhilo

4
Non vedo come dateutil.parser.parse possa analizzare le durate, sembra che restituisca sempre un datetime. Cosa mi sto perdendo?
Nickolay

7
dateutil.parser.parsenon analizzerà gli timedeltaoggetti. Restituisce a datetimee attiverà un'eccezione per stringhe come '28:32:11.10'.
Parla il

95

Per me la soluzione più elegante, senza dover ricorrere a librerie esterne come dateutil o analizzare manualmente l'input, è usare il potente strptimemetodo di analisi delle stringhe di datetime .

from datetime import datetime, timedelta
# we specify the input and the format...
t = datetime.strptime("05:20:25","%H:%M:%S")
# ...and use datetime's hour, min and sec properties to build a timedelta
delta = timedelta(hours=t.hour, minutes=t.minute, seconds=t.second)

Dopodiché puoi usare il tuo oggetto timedelta normalmente, convertirlo in secondi per assicurarti di aver fatto la cosa corretta ecc.

print(delta)
assert(5*60*60+20*60+25 == delta.total_seconds())

33
Nota che questo approccio funziona solo se il periodo di tempo è inferiore a 24 ore ( datetime.strptime("32:20:25","%H:%M:%S")non funziona) e devi conoscere il formato di input esatto.
verdesmarald

Anche questa parte risponde solo alla domanda del PO. Se la funzione deve gestire più formati, è comunque necessaria un'ispezione del formato aggiuntiva (1 due punti o 2?).
Danny Staple

3
@verdesmarald Quindi, a partire da python 3.5, esiste una soluzione elegante senza utilizzare librerie esterne e senza presumere che il periodo di tempo sia inferiore a 24 ore?
max

1
Trovo la necessità di specificare manualmente i parametri nominati per il timedeltaparametro piuttosto fastidioso, ma il meglio che posso trovare per evitarlo è:, delta = t - datetime.combine(t.date(), time.min)che è ... orribile.
Kyle Strand

2
Un problema serio con questo approccio è che se includi i giorni quindi l'invio di% d in strptime, non ti consentirà di inserire il giorno 0, poiché solo i giorni> = 1 sono validi per una data.
user1581390

75

Ieri avevo un po 'di tempo a disposizione, quindi ho sviluppato la risposta di @virhilo in un modulo Python, aggiungendo qualche altro formato di espressione temporale, inclusi tutti quelli richiesti da @priestc .

Il codice sorgente è su GitHub (licenza MIT) per chiunque lo desideri. È anche su PyPI:

pip install pytimeparse

Restituisce il tempo come numero di secondi:

>>> from pytimeparse.timeparse import timeparse
>>> timeparse('32m')
1920
>>> timeparse('2h32m')
9120
>>> timeparse('4:13')
253
>>> timeparse('5hr34m56s')
20096
>>> timeparse('1.2 minutes')
72

esiste un equivalente Java / Scala?
luca.giovagnoli

Eccezionale! Grazie mille
Bouncner

@ luca.giovagnoli In Scala puoi usare la classe Duration. La durata può essere costruita da stringhe come '15 secondi ',' 4 minuti 'ecc.
Konrad Malik

14

Volevo inserire solo un tempo e poi aggiungerlo a varie date, quindi questo ha funzionato per me:

from datetime import datetime as dtt

time_only = dtt.strptime('15:30', "%H:%M") - dtt.strptime("00:00", "%H:%M")

dtt.strptime(myduration, "%H:%M:%S") - dtt(1900, 1, 1)funziona anche ...
576i

8

Ho modificato la bella risposta di virhilo con alcuni aggiornamenti:

  • ha aggiunto un'asserzione che la stringa è una stringa di tempo valida
  • sostituire l'indicatore delle ore "hr" con "h"
  • consentire un indicatore "d" - giorni
  • consenti tempi non interi (ad esempio 3m0.25sè di 3 minuti, 0,25 secondi)

.

import re
from datetime import timedelta


regex = re.compile(r'^((?P<days>[\.\d]+?)d)?((?P<hours>[\.\d]+?)h)?((?P<minutes>[\.\d]+?)m)?((?P<seconds>[\.\d]+?)s)?$')


def parse_time(time_str):
    """
    Parse a time string e.g. (2h13m) into a timedelta object.

    Modified from virhilo's answer at https://stackoverflow.com/a/4628148/851699

    :param time_str: A string identifying a duration.  (eg. 2h13m)
    :return datetime.timedelta: A datetime.timedelta object
    """
    parts = regex.match(time_str)
    assert parts is not None, "Could not parse any time information from '{}'.  Examples of valid strings: '8h', '2d8h5m20s', '2m4s'".format(time_str)
    time_params = {name: float(param) for name, param in parts.groupdict().items() if param}
    return timedelta(**time_params)

1
Grande! Ho aggiunto "*" tra gli elementi per consentire anche "1g 3h 5m"
Marcel Waldvogel

@MarcelWaldvogel gentile, se copi il testo della nuova regex aggiungerò la tua risposta in
Peter

@virhilo e Peter: la mia leggera evoluzione del tuo codice è qui: github.com/zeitgitter/zeitgitterd/blob/master/zeitgitter/… . Presumo che sia OK usare il tuo codice. Hai delle preferenze per la licenza? MIT, Apache, GPL, ...?
Marcel Waldvogel

1
Marcel, puoi inviarmi il tuo indirizzo così posso fare causa? JK va avanti qualsiasi licenza va bene.
Peter il

Ecco il nuovo Regex; la differenza è "*" s: regex = re.compile (r '^ ((? P <days> [\. \ d] +?) d)? *' r '((? P <hours> [\ . \ d] +?) h)? * 'r' ((? P <minuti> [\. \ d] +?) m)? * 'r' ((? P <secondi> [\. \ d] +?) s)? $ ')
Marcel Waldvogel il

3

Se usi Python 3, ecco la versione aggiornata per la soluzione di Hari Shankar, che ho usato:

from datetime import timedelta
import re

regex = re.compile(r'(?P<hours>\d+?)/'
                   r'(?P<minutes>\d+?)/'
                   r'(?P<seconds>\d+?)$')

def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    print(parts)
    time_params = {}
    for name, param in parts.items():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)

3

Django viene fornito con la funzione di utilità parse_duration(). Dalla documentazione :

Analizza una stringa e restituisce a datetime.timedelta .

Si aspetta i dati nel formato "DD HH:MM:SS.uuuuuu"o come specificato da ISO 8601 (ad esempio, P4DT1H15M20Sche è equivalente a 4 1:15:20) o nel formato dell'intervallo di tempo diurno di PostgreSQL (ad esempio 3 days 04:05:06).


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.