纪元秒 (UTC) 的日期字符串
Date string to epoch seconds (UTC)
问题
我想将作为字符串 (UTC) 给出的日期时间解析为自 纪元 以来的秒数。示例(参见 EpochConverter):
2019-01-15 10:00:00 -> 1547546400
问题
在一个非常相关的问题 C++ Converting a time string to seconds from the epoch 中也被接受的直接解决方案是 std::string -> std::tm -> std::time_t
使用 std::get_time
然后 std::mktime
:
std::tm tm;
std::stringstream ss("2019-01-15 10:00:00");
ss >> std::get_time(&tm, "%Y-%m-%d %H:%M:%S");
std::time_t epoch = std::mktime(&tm);
// 1547546400 (expected)
// 1547539200 (actual, 2 hours too early)
但是 std::mktime
似乎由于时区的原因弄乱了时间。我正在执行来自 UTC+01:00
的代码,但我们在那个日期也有夏令时,所以这里是 +2
。
对于 std::get_time
之后的 hour
字段,tm
显示 15
。一进std::mktime
.
就乱了
因此,字符串将被解释为 UTC 时间戳,不应涉及任何时区。但是我想出的所有解决方案似乎都将其解释为本地时间戳并为其添加偏移量。
限制
我对此有一些限制:
- C++17
- platform/compiler独立
- 没有环境变量黑客攻击
- 没有外部库(比如 boost)
尽管出于问答的目的,请随意 post 回答涉及这些问题的问题,但我不会接受它们。
研究
我找到了解决这个问题的各种尝试,但是none满足了我的要求:
std::mktime
(如上所述),弄乱了时间,因为它假定本地时间
strptime
,在我的平台上不可用,不属于标准
timegm
(这正是我所需要的),与平台无关
_mkgmtime
,与平台无关
boost::posix_time::from_iso_string
,是一个外部库
std::chrono::date::parse
,不适用于 C++17
- 使用
tzset
清除并重置时区变量,使用环境变量 hacking
- 用
mktime(localtime(×tamp)) - mktime(gmtime(×tamp))
手动计算偏移量,计算出错误的偏移量,因为它不考虑夏令时(在我的平台上是 1 小时,但需要 2 小时)
我最近也有同样的需求。我很失望地发现 DST 和时区的处理在编写时间戳和解析它们之间似乎不一致。
我想出的代码是这样的:
void time_point_from_stream(std::istream &is, system_clock::time_point &tp)
{
std::tm tm {};
is >> std::get_time(&tm, "%Y-%m-%dT%H:%M:%S");
// unhappily, mktime thinks it's reading local time with DST adjustments
auto my_time_t = std::mktime(&tm);
my_time_t += tm.tm_gmtoff;
if (tm.tm_isdst == 1)
my_time_t -= 3600;
tp = system_clock::from_time_t(my_time_t);
if (not is)
return;
auto ch = is.peek();
if (std::isspace(ch))
return;
if (ch == '.')
{
double zz;
is >> zz;
auto zseconds = std::chrono::duration< double >(zz);
tp += chrono::duration_cast< system_clock::duration >(zseconds);
if (not is)
return;
ch = is.peek();
}
if (ch == 'Z')
is.get();
else if (not isspace(ch))
{
is.setstate(std::ios::failbit);
}
}
基本上,步骤是:
- 用
std::get_time
填一个tm
- 使用
std::mktime
将其转换为 time_t
- 反转时区和 DST 调整
- 转换为
std::chrono::system_clock::time_point
- 解析小数秒并调整结果。
我相信 c++20 改善了这种情况。
Howard Hinnant 还编写了一个改进的 date/time 库。还有 boost::posix_time
,我一直觉得它比 std
产品更容易使用。
C++20 之前的解决方案:自己动手。
有了正确的文档,它确实比听起来容易得多,如果不需要太多错误检测,甚至可以快如闪电。
第一个问题是在不对其中任何一个进行操作的情况下解析数字。您只需要读取长度为 2 位和 4 位的无符号值,所以只需做到最低限度即可:
int
read2(std::string const& str, int pos)
{
return (str[pos] - '0')*10 + (str[pos+1] - '0');
}
int
read4(std::string const& str, int pos)
{
return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
(str[pos+2] - '0')*10 + (str[pos+3] - '0');
}
现在给定一个字符串,很容易解析出您需要的不同值:
// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
auto y = read4(str, 0);
auto m = read2(str, 5);
auto d = read2(str, 8);
...
通常让人感到困惑的部分是如何将三元组 {y, m, d}
转换为天数 since/prior 1970-01-01。这里有一个 collection of public domain calendrical algorithms 可以帮助您做到这一点。这是 不是 第三方 date/time 库。这是一个关于算法的教程,您需要编写您自己的 date/time 库。这些算法 高效 。没有迭代。没有大桌子。这使它们对管道和缓存非常友好。他们在 +/- 一百万年的时间跨度内进行了单元测试。因此,您不必担心会触及它们的任何正确性界限。如果你对它们的工作原理感兴趣,这些算法也有非常深入的推导。
所以只需转到 collection of public domain calendrical algorithms,选择您需要的算法(并根据需要自定义它们),然后推出您自己的转换器。
例如:
#include <cstdint>
#include <limits>
#include <string>
int
days_from_civil(int y, unsigned m, unsigned d) noexcept
{
static_assert(std::numeric_limits<unsigned>::digits >= 18,
"This algorithm has not been ported to a 16 bit unsigned integer");
static_assert(std::numeric_limits<int>::digits >= 20,
"This algorithm has not been ported to a 16 bit signed integer");
y -= m <= 2;
const int era = (y >= 0 ? y : y-399) / 400;
const unsigned yoe = static_cast<unsigned>(y - era * 400); // [0, 399]
const unsigned doy = (153*(m + (m > 2 ? -3 : 9)) + 2)/5 + d-1; // [0, 365]
const unsigned doe = yoe * 365 + yoe/4 - yoe/100 + doy; // [0, 146096]
return era * 146097 + static_cast<int>(doe) - 719468;
}
int
read2(std::string const& str, int pos)
{
return (str[pos] - '0')*10 + (str[pos+1] - '0');
}
int
read4(std::string const& str, int pos)
{
return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
(str[pos+2] - '0')*10 + (str[pos+3] - '0');
}
// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
auto y = read4(str, 0);
auto m = read2(str, 5);
auto d = read2(str, 8);
auto h = read2(str, 11);
auto M = read2(str, 14);
auto s = read2(str, 17);
return days_from_civil(y, m, d)*86400LL + h*3600 + M*60 + s;
}
#include <iostream>
int
main()
{
std::cout << EpochConverter("2019-01-15 10:00:00") << '\n';
}
这只是为我输出:
1547546400
添加适合您的应用程序的任何错误检测。
问题
我想将作为字符串 (UTC) 给出的日期时间解析为自 纪元 以来的秒数。示例(参见 EpochConverter):
2019-01-15 10:00:00 -> 1547546400
问题
在一个非常相关的问题 C++ Converting a time string to seconds from the epoch 中也被接受的直接解决方案是 std::string -> std::tm -> std::time_t
使用 std::get_time
然后 std::mktime
:
std::tm tm;
std::stringstream ss("2019-01-15 10:00:00");
ss >> std::get_time(&tm, "%Y-%m-%d %H:%M:%S");
std::time_t epoch = std::mktime(&tm);
// 1547546400 (expected)
// 1547539200 (actual, 2 hours too early)
但是 std::mktime
似乎由于时区的原因弄乱了时间。我正在执行来自 UTC+01:00
的代码,但我们在那个日期也有夏令时,所以这里是 +2
。
对于 std::get_time
之后的 hour
字段,tm
显示 15
。一进std::mktime
.
因此,字符串将被解释为 UTC 时间戳,不应涉及任何时区。但是我想出的所有解决方案似乎都将其解释为本地时间戳并为其添加偏移量。
限制
我对此有一些限制:
- C++17
- platform/compiler独立
- 没有环境变量黑客攻击
- 没有外部库(比如 boost)
尽管出于问答的目的,请随意 post 回答涉及这些问题的问题,但我不会接受它们。
研究
我找到了解决这个问题的各种尝试,但是none满足了我的要求:
std::mktime
(如上所述),弄乱了时间,因为它假定本地时间strptime
,在我的平台上不可用,不属于标准timegm
(这正是我所需要的),与平台无关_mkgmtime
,与平台无关boost::posix_time::from_iso_string
,是一个外部库std::chrono::date::parse
,不适用于 C++17- 使用
tzset
清除并重置时区变量,使用环境变量 hacking - 用
mktime(localtime(×tamp)) - mktime(gmtime(×tamp))
手动计算偏移量,计算出错误的偏移量,因为它不考虑夏令时(在我的平台上是 1 小时,但需要 2 小时)
我最近也有同样的需求。我很失望地发现 DST 和时区的处理在编写时间戳和解析它们之间似乎不一致。
我想出的代码是这样的:
void time_point_from_stream(std::istream &is, system_clock::time_point &tp)
{
std::tm tm {};
is >> std::get_time(&tm, "%Y-%m-%dT%H:%M:%S");
// unhappily, mktime thinks it's reading local time with DST adjustments
auto my_time_t = std::mktime(&tm);
my_time_t += tm.tm_gmtoff;
if (tm.tm_isdst == 1)
my_time_t -= 3600;
tp = system_clock::from_time_t(my_time_t);
if (not is)
return;
auto ch = is.peek();
if (std::isspace(ch))
return;
if (ch == '.')
{
double zz;
is >> zz;
auto zseconds = std::chrono::duration< double >(zz);
tp += chrono::duration_cast< system_clock::duration >(zseconds);
if (not is)
return;
ch = is.peek();
}
if (ch == 'Z')
is.get();
else if (not isspace(ch))
{
is.setstate(std::ios::failbit);
}
}
基本上,步骤是:
- 用
std::get_time
填一个tm
- 使用
std::mktime
将其转换为time_t
- 反转时区和 DST 调整
- 转换为
std::chrono::system_clock::time_point
- 解析小数秒并调整结果。
我相信 c++20 改善了这种情况。
Howard Hinnant 还编写了一个改进的 date/time 库。还有 boost::posix_time
,我一直觉得它比 std
产品更容易使用。
C++20 之前的解决方案:自己动手。
有了正确的文档,它确实比听起来容易得多,如果不需要太多错误检测,甚至可以快如闪电。
第一个问题是在不对其中任何一个进行操作的情况下解析数字。您只需要读取长度为 2 位和 4 位的无符号值,所以只需做到最低限度即可:
int
read2(std::string const& str, int pos)
{
return (str[pos] - '0')*10 + (str[pos+1] - '0');
}
int
read4(std::string const& str, int pos)
{
return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
(str[pos+2] - '0')*10 + (str[pos+3] - '0');
}
现在给定一个字符串,很容易解析出您需要的不同值:
// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
auto y = read4(str, 0);
auto m = read2(str, 5);
auto d = read2(str, 8);
...
通常让人感到困惑的部分是如何将三元组 {y, m, d}
转换为天数 since/prior 1970-01-01。这里有一个 collection of public domain calendrical algorithms 可以帮助您做到这一点。这是 不是 第三方 date/time 库。这是一个关于算法的教程,您需要编写您自己的 date/time 库。这些算法 高效 。没有迭代。没有大桌子。这使它们对管道和缓存非常友好。他们在 +/- 一百万年的时间跨度内进行了单元测试。因此,您不必担心会触及它们的任何正确性界限。如果你对它们的工作原理感兴趣,这些算法也有非常深入的推导。
所以只需转到 collection of public domain calendrical algorithms,选择您需要的算法(并根据需要自定义它们),然后推出您自己的转换器。
例如:
#include <cstdint>
#include <limits>
#include <string>
int
days_from_civil(int y, unsigned m, unsigned d) noexcept
{
static_assert(std::numeric_limits<unsigned>::digits >= 18,
"This algorithm has not been ported to a 16 bit unsigned integer");
static_assert(std::numeric_limits<int>::digits >= 20,
"This algorithm has not been ported to a 16 bit signed integer");
y -= m <= 2;
const int era = (y >= 0 ? y : y-399) / 400;
const unsigned yoe = static_cast<unsigned>(y - era * 400); // [0, 399]
const unsigned doy = (153*(m + (m > 2 ? -3 : 9)) + 2)/5 + d-1; // [0, 365]
const unsigned doe = yoe * 365 + yoe/4 - yoe/100 + doy; // [0, 146096]
return era * 146097 + static_cast<int>(doe) - 719468;
}
int
read2(std::string const& str, int pos)
{
return (str[pos] - '0')*10 + (str[pos+1] - '0');
}
int
read4(std::string const& str, int pos)
{
return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
(str[pos+2] - '0')*10 + (str[pos+3] - '0');
}
// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
auto y = read4(str, 0);
auto m = read2(str, 5);
auto d = read2(str, 8);
auto h = read2(str, 11);
auto M = read2(str, 14);
auto s = read2(str, 17);
return days_from_civil(y, m, d)*86400LL + h*3600 + M*60 + s;
}
#include <iostream>
int
main()
{
std::cout << EpochConverter("2019-01-15 10:00:00") << '\n';
}
这只是为我输出:
1547546400
添加适合您的应用程序的任何错误检测。