更漂亮的Multiple DateTimeFormatter?

More beautiful Multiple DateTimeFormatter?

我有多个字符串日期要转换为 OffsetDateTime 并且我通过多次尝试和捕捉来做到这一点,我想我不会有其他 DateTimeFormatter 可以写了。那么,如何让它更漂亮呢?

代码:

public static OffsetDateTime convertStringDateToOffsetDate(String dateStr){
        DateTimeFormatter f = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSSXXX").withLocale( Locale.US );
        DateTimeFormatter f2 = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss").withZone(ZoneId.of("Europe/Paris"));
        DateTimeFormatter f3 = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ssXXX").withZone(ZoneId.of("Europe/Paris"));
        DateTimeFormatter f4 = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSSSSS").withZone(ZoneId.of("Europe/Paris"));
        DateTimeFormatter f5 = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSS").withZone(ZoneId.of("Europe/Paris"));
        DateTimeFormatter f6 = DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSSSSSXXX").withZone(ZoneId.of("Europe/Paris"));
        OffsetDateTime myDate = null;
        try{
            myDate = ZonedDateTime.parse(dateStr, f).toOffsetDateTime();
        } catch(DateTimeParseException e){
            try{
                myDate = ZonedDateTime.parse(dateStr, f2).toOffsetDateTime();
            } catch (DateTimeParseException ex) {
                try{
                    myDate = ZonedDateTime.parse(dateStr, f3).toOffsetDateTime();
                } catch (DateTimeParseException exc) {
                    try{
                        myDate = ZonedDateTime.parse(dateStr, f4).toOffsetDateTime();
                    }  catch (DateTimeParseException exce) {
                        try{
                            myDate = ZonedDateTime.parse(dateStr, f5).toOffsetDateTime();
                        } catch(DateTimeParseException excep){
                            myDate = ZonedDateTime.parse(dateStr, f6).toOffsetDateTime();
                        }
                    }
                }
            }
        }

        return myDate;
    }

您可以在循环内使用单个 try-catch,异常会被忽略。

List<DateTimeFormatter> list = Arrays.toList<>(f, f1, f2, f3, f4, f5, f6);
for(DateTimeFormatter formatter : list)
{
    try
    {
        myDate = ZonedDateTime.parse(dateStr, formatter).toOffsetDateTime();
        break;
    }
    catch(Exception e)
    {
    }
}

但请记住,异常的性能很差(将堆栈跟踪写入变量需要时间),所以也许 M. Dudek 关于使用正则表达式的评论可能是更好的答案。

public static OffsetDateTime convertStringDateToOffsetDate(String dateStr){
    DateTimeFormatter f = DateTimeFormatter.ofPattern("yyyy-MM-dd['T'][ ][HH:mm:ss][.][SSSSSS][SSSSS][SSSS][SSS][XXX][XX][X]").withZone(ZoneId.of("Europe/Paris"));
    return ZonedDateTime.parse(dateStr, f).toOffsetDateTime();
}

这应该可以处理您的所有模式。不需要多个格式化程序或正则表达式。

您可以使用 [] 语法将部分格式字符串声明为可选。这可能只是让您找到一个可以处理所有问题的单一模式。但是,这种设置中一个模式具有美国语言环境而其他模式没有,该部分不适合单一格式字符串。因此,您可以减少您拥有的格式字符串的数量,但可能不会减少到一个。

然后,使用列表和辅助方法来实现干净的代码:

private static final List<DateTimeFormatter> FORMATS = List.of(
    DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss.SSSXXX").withLocale( Locale.US ),
    DateTimeFormatter.ofPattern("yyyy-MM-dd'T'HH:mm:ss[.][SSSSSS][XXX]").withZone(ZoneId.of("Europe/Paris")));

public static OffsetDateTime parse(String dateStr) throws DateTimeParseException {
  DateTimeParseException ex = null;

  for (var format : FORMATS) try {
      return ZonedDateTime.parse(dateStr, format).toOffsetDateTime();
  } catch (DateTimeParseException e) {
    ex = e;
  }
  throw ex;
}

这是我的尝试。

private static final DateTimeFormatter PARSER = new DateTimeFormatterBuilder()
        .append(DateTimeFormatter.ISO_LOCAL_DATE_TIME)
        .optionalStart()
        .appendOffsetId()
        .optionalEnd()
        .toFormatter(Locale.ROOT);

private static final ZoneId DEFAULT_ZONE = ZoneId.of("Europe/Paris");

public static OffsetDateTime convertStringDateToOffsetDate(String dateStr) {
    TemporalAccessor parsed
            = PARSER.parseBest(dateStr, OffsetDateTime::from, LocalDateTime::from);
    if (parsed instanceof OffsetDateTime) {
        return (OffsetDateTime) parsed;
    } else {
        return ((LocalDateTime) parsed).atZone(DEFAULT_ZONE).toOffsetDateTime();
    }
}

尝试一下:

    String[] testStrings = {
            "2021-01-01T12:34:56.789-07:00",
            "2021-02-01T12:34:56",
            "2021-03-01T12:34:56-06:00",
            "2021-04-01T12:34:56.987654",
            "2021-05-01T12:34:56.789",
            "2021-06-01T12:34:56.987654-05:00"
    };
    
    for (String testString : testStrings) {
        System.out.format("%-32s -> %s%n", testString, convertStringDateToOffsetDate(testString));
    }

输出:

2021-01-01T12:34:56.789-07:00    -> 2021-01-01T12:34:56.789-07:00
2021-02-01T12:34:56              -> 2021-02-01T12:34:56+01:00
2021-03-01T12:34:56-06:00        -> 2021-03-01T12:34:56-06:00
2021-04-01T12:34:56.987654       -> 2021-04-01T12:34:56.987654+02:00
2021-05-01T12:34:56.789          -> 2021-05-01T12:34:56.789+02:00
2021-06-01T12:34:56.987654-05:00 -> 2021-06-01T12:34:56.987654-05:00

您注意到:

  • 它处理您问题中的所有 6 种格式。
  • 对于其中具有UTC偏移量的字符串,将保留偏移量。对于没有的字符串,假定巴黎的正确偏移量(2 月为 +01:00,4 月和 5 月为 +02:00)。

我认为它有以下优点:

  • 我只需要一个格式化程序。
  • 我根本没有编写格式模式字符串,只是从内置部件组装了我的格式化程序。

我用来解析的DateTimeFormatter.parseBest方法将首先尝试创建一个OffsetDateTime,如果不成功,它将求助于创建并返回一个LocalDateTime。在后一种情况下,我需要转换它。我的解决方案的缺点是我需要通过一个 TemporalAccessor,这是一个我认为是低级的接口,我们通常不应该在应用程序代码中使用它。

内置的 DateTimeFOrmatter.ISO_LOCAL_DATE_TIME 已经处理了秒中最多 9 位小数的存在和缺失。因此,通过在我的格式化程序中重复使用它,我已经处理了没有小数以及 3 位和 6 位小数的情况。

您要求对没有偏移量的字符串使用 Europe/Paris 时区的一个挑战是,虽然 DateTimeFormatter 可以有很多默认值,但它不能有默认时区。 withZone 方法为我们提供了一个带有 覆盖区域 的格式化程序,但这是另外一回事。该格式化程序将强制 对格式化或解析结果的覆盖区域。虽然从你的问题中不清楚,但我假设你不想要这个。

编辑:格式化程序需要语言环境吗? 我使用 .toFormatter(Locale.ROOT) 从构建器构建格式化程序。从技术上讲,在这种情况下不需要语言环境,因为我的格式化程序不包含任何依赖于语言环境的部分,并且在这个答案的第一个版本中我已经离开了语言环境(调用 no-arg toFormatter 方法反而)。但是我倾向于同意 Arvind Kumar Avinash 的评论:

Just small nitpicking: Please always use Locale with a date-time parsing/formatting type … because it is a Locale-sensitive type. It may not be relevant for the date-time strings dealt with in this solution but we should stick to it as if it were a rule.

这可能只是我自大,并假设 reader 能够确定格式化程序中没有区域设置敏感的部分。提供语言环境是更好的习惯(否则至少坚持评论为什么没有语言环境)。