纪元秒 (UTC) 的日期字符串

Date string to epoch seconds (UTC)

问题

我想将作为字符串 (UTC) 给出的日期时间解析为自 纪元 以来的秒数。示例(参见 EpochConverter):

2019-01-15 10:00:00 -> 1547546400

问题

在一个非常相关的问题 C++ Converting a time string to seconds from the epoch 中也被接受的直接解决方案是 std::string -> std::tm -> std::time_t 使用 std::get_time 然后 std::mktime:

std::tm tm;
std::stringstream ss("2019-01-15 10:00:00");
ss >> std::get_time(&tm, "%Y-%m-%d %H:%M:%S");
std::time_t epoch = std::mktime(&tm);
// 1547546400 (expected)
// 1547539200 (actual, 2 hours too early)

但是 std::mktime 似乎由于时区的原因弄乱了时间。我正在执行来自 UTC+01:00 的代码,但我们在那个日期也有夏令时,所以这里是 +2

对于 std::get_time 之后的 hour 字段,tm 显示 15。一进std::mktime.

就乱了

因此,字符串将被解释为 UTC 时间戳,不应涉及任何时区。但是我想出的所有解决方案似乎都将其解释为本地时间戳并为其添加偏移量。


限制

我对此有一些限制:

尽管出于问答的目的,请随意 post 回答涉及这些问题的问题,但我不会接受它们。


研究

我找到了解决这个问题的各种尝试,但是none满足了我的要求:

我最近也有同样的需求。我很失望地发现 DST 和时区的处理在编写时间戳和解析它们之间似乎不一致。

我想出的代码是这样的:

void time_point_from_stream(std::istream &is, system_clock::time_point &tp)
{
    std::tm tm {};
    is >> std::get_time(&tm, "%Y-%m-%dT%H:%M:%S");

    // unhappily, mktime thinks it's reading local time with DST adjustments
    auto my_time_t = std::mktime(&tm);
    my_time_t += tm.tm_gmtoff;

    if (tm.tm_isdst == 1)
        my_time_t -= 3600;

    tp = system_clock::from_time_t(my_time_t);

    if (not is)
        return;
    auto ch = is.peek();

    if (std::isspace(ch))
        return;

    if (ch == '.')
    {
        double zz;
        is >> zz;
        auto zseconds = std::chrono::duration< double >(zz);
        tp += chrono::duration_cast< system_clock::duration >(zseconds);
        if (not is)
            return;
        ch = is.peek();
    }

    if (ch == 'Z')
        is.get();
    else if (not isspace(ch))
    {
        is.setstate(std::ios::failbit);
    }
}

基本上,步骤是:

  1. std::get_time填一个tm
  2. 使用 std::mktime 将其转换为 time_t
  3. 反转时区和 DST 调整
  4. 转换为 std::chrono::system_clock::time_point
  5. 解析小数秒并调整结果。

我相信 c++20 改善了这种情况。

Howard Hinnant 还编写了一个改进的 date/time 库。还有 boost::posix_time,我一直觉得它比 std 产品更容易使用。

C++20 之前的解决方案:自己动手。

有了正确的文档,它确实比听起来容易得多,如果不需要太多错误检测,甚至可以快如闪电。

第一个问题是在不对其中任何一个进行操作的情况下解析数字。您只需要读取长度为 2 位和 4 位的无符号值,所以只需做到最低限度即可:

int
read2(std::string const& str, int pos)
{
    return (str[pos] - '0')*10 + (str[pos+1]  - '0');
}

int
read4(std::string const& str, int pos)
{
    return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
           (str[pos+2] - '0')*10 + (str[pos+3]  - '0');
}

现在给定一个字符串,很容易解析出您需要的不同值:

// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
    auto y = read4(str, 0);
    auto m = read2(str, 5);
    auto d = read2(str, 8);
    ...

通常让人感到困惑的部分是如何将三元组 {y, m, d} 转换为天数 since/prior 1970-01-01。这里有一个 collection of public domain calendrical algorithms 可以帮助您做到这一点。这是 不是 第三方 date/time 库。这是一个关于算法的教程,您需要编写您自己的 date/time 库。这些算法 高效 。没有迭代。没有大桌子。这使它们对管道和缓存非常友好。他们在 +/- 一百万年的时间跨度内进行了单元测试。因此,您不必担心会触及它们的任何正确性界限。如果你对它们的工作原理感兴趣,这些算法也有非常深入的推导。

所以只需转到 collection of public domain calendrical algorithms,选择您需要的算法(并根据需要自定义它们),然后推出您自己的转换器。

例如:

#include <cstdint>
#include <limits>
#include <string>

int
days_from_civil(int y, unsigned m, unsigned d) noexcept
{
    static_assert(std::numeric_limits<unsigned>::digits >= 18,
             "This algorithm has not been ported to a 16 bit unsigned integer");
    static_assert(std::numeric_limits<int>::digits >= 20,
             "This algorithm has not been ported to a 16 bit signed integer");
    y -= m <= 2;
    const int era = (y >= 0 ? y : y-399) / 400;
    const unsigned yoe = static_cast<unsigned>(y - era * 400);      // [0, 399]
    const unsigned doy = (153*(m + (m > 2 ? -3 : 9)) + 2)/5 + d-1;  // [0, 365]
    const unsigned doe = yoe * 365 + yoe/4 - yoe/100 + doy;         // [0, 146096]
    return era * 146097 + static_cast<int>(doe) - 719468;
}

int
read2(std::string const& str, int pos)
{
    return (str[pos] - '0')*10 + (str[pos+1]  - '0');
}

int
read4(std::string const& str, int pos)
{
    return (str[pos] - '0')*1000 + (str[pos+1] - '0')*100 +
           (str[pos+2] - '0')*10 + (str[pos+3]  - '0');
}

// yyyy-mm-dd hh:MM:ss -> count of non-leap seconds since 1970-01-01 00:00:00 UTC
// 0123456789012345678
long long
EpochConverter(std::string const& str)
{
    auto y = read4(str, 0);
    auto m = read2(str, 5);
    auto d = read2(str, 8);
    auto h = read2(str, 11);
    auto M = read2(str, 14);
    auto s = read2(str, 17);
    return days_from_civil(y, m, d)*86400LL + h*3600 + M*60 + s;
}

#include <iostream>

int
main()
{
    std::cout << EpochConverter("2019-01-15 10:00:00") << '\n';
}

这只是为我输出:

1547546400

添加适合您的应用程序的任何错误检测。