如何使用 dateutil.tz.tz.tzoffset 来本地化使用 strptime 创建的时区原始日期时间?

How can I use a dateutil.tz.tz.tzoffset to localize a timezone naive datetime created using strptime?

如何使用 dateutil.tz.tz.tzoffset 类型的对象来本地化具有正确时区和 DST 信息的时区原始日期时间对象,以便将其正确转换为 UTC?或者,如何将 dateutil.tz.tz.tzoffset 转换为 pytz.timezone?

我无法找到有关使用 dateutil.tz.tz.tzoffset 对象本地化日期时间对象的有用信息。请参阅下面我评论过的一些更好的文章。

背景信息:

我正在处理大量日期字符串,其中大部分没有时区信息。在某些情况下,时间为格林威治标准时间,而在其他情况下,时间为本地时间。我必须首先确定创建这些各种日志的设备的时区,然后解析各种日期字符串,如果是本地时间则添加添加时区,最后将其转换为 UTC。

除了确定时区的唯一可靠方法是从一个文本文件中,该文件的日期格式为 EDT、IST 等,我几乎已经完成了所有这些工作,所以我使用了最高投票 post 下面的 link 来使用 dateutil 的 parser.parse() 函数完成这个,并为它的 tzinfos 参数发送一个字典。 (Parsing date/time string with timezone abbreviated name in Python?)

然而,这给我留下了一个 datetime,它有一个 tzinfo 类型=dateutil.tz.tz.tzoffset。我没问题,除非我需要使用这个 tzinfo 来本地化不包含时区信息的字符串,并且 dateutil.tz.tz.tzoffset 类型没有像 pytz.timezone 那样的本地化选项,这是症结所在我的问题。

我是不是太难了?我是否只是用我保存的 dateutil.tz.tz.tzoffset 对象替换时区原始日期时间中的 tzinfo?

代码:

下面读取日期字符串并将其保存为日期时间对象,将时区保存在 var 中供以后使用,然后将日期字符串转换为 UTC:

from dateutil.parser import parse as parsedate
import pytz
from pytz import timezone
from datetime import datetime

timestr = 'Sat, 5/01/2019 8:00PM EDT' #only reliable source of timezone info
dtfromstrEDT = parsedate(timestr, tzinfos=tzd) #tzd is created from the above link
mytimeZone = dtfromstrEDT.tzinfo  # save local timezone
dtUTC = dtfromstrEDT.astimezone(pytz.timezone('UTC'))  # convert to utc

现在这是一个新的时区原始日期字符串。它是在与上述相同的当地时间 (EDT) 中记录的,因此我想使用我保存的 mytimeZone var 对其进行本地化并转换为 UTC。我使用标准 strptime 将其作为天真的日期时间读取。但是,当使用 mytimeZone 本地化 Naive 日期时间时,它失败了。错误如下。我明白错误;但我不知道如何完成我需要的:

timestrnaive = 'Mar 15 12:09:20 2019' #in EDT time, same as above string but without any timezone info
dtfromstrNaive = datetime.strptime(timestrnaive, "%b %d %H:%M:%S %Y")
dtlocalized = mytimeZone.localize(dtfromstrNaive, is_dst=True)  
# the above is where it fails with provided error below
# however I can do this instead if I had a pytz.timezone object:
loc_tz = pytz.timezone('America/New_York')
dtlocalized = loc_tz.localize(dtfromstrNaive, is_dst=True) 
dtUTC2 = dtlocalized.astimezone(pytz.timezone('UTC'))  # convert to utc

错误:

Traceback (most recent call last):
  File "C:\Examples\timezones.py", line 221, in <module>
    dtlocalized = mytimeZone.localize(dtfromstrNaive, is_dst=True)  # convert to whatever tz is stored in self.timeZone
AttributeError: 'tzoffset' object has no attribute 'localize'

评论了以下内容:

Localize datetime (timezone aware) from timezone offset - 我不确定如何将其应用于此问题,因为我有一个 dateutil.tz.tz.tzoffset 对象,而不是原始的 utc 时间。

Parsing date/time string with timezone abbreviated name in Python? - 这让我可以读取时区数据,例如 EDT 和 PDT。

How to make an unaware datetime timezone aware in python - 这没有帮助,因为它没有解决我提到的 dateutil.tz.tz.tzoffset 问题。

经过更多测试后,我意识到我做得太难了。解决方案很简单:

timestrnaive = 'Mar 15 12:09:20 2019'
dtfromstrNaive = datetime.strptime(timestrnaive, "%b %d %H:%M:%S %Y") 
dtlocalized = dtfromstrNaive.replace(tzinfo=mytimeZone)
dtUTC2 = dtlocalized.astimezone(pytz.timezone('UTC'))  # convert to utc

您在这里怀有的主要误解是您需要 localize 方法,这是 pytz 中的历史产物,源自 PEP 495 添加 "fold" 属性之前的时代.您可以在 this article.

中阅读更多关于 pytz 偏离标准库接口的原因

正如您在回答中指出的那样,对于 other 而不是 pytz 区域,您可以简单地使用 .replace 构建一个具有适当的新日期时间时区。还有一个 dateutil.utils.default_tzinfo 便利函数,它会自动检测日期时间是否天真,如果是,则将默认值附加到 tzinfo

还有一点需要注意的是,你在这里使用 pytz 是不必要的,因为 dateutil 也提供了一个 UTC 对象,所以你可以这样做:

from dateutil import tz
timestrnaive = 'Mar 15 12:09:20 2019'
dtfromstrNaive = datetime.strptime(timestrnaive, "%b %d %H:%M:%S %Y") 
dtlocalized = dtfromstrNaive.replace(tzinfo=mytimeZone)
dtUTC2 = dtlocalized.astimezone(tz.UTC) # Convert to UTC

因此您不需要对 pytz.

保持任何依赖

如果您想了解有关在 Python 中使用时区的更多信息,我也 recently gave a talk about this at PyCon