NOT followedBy 的 Apache Flink CEP 模式操作

Apache Flink CEP Pattern operation for NOT followedBy

我有一个场景,如果第二个事件没有在 x 秒内跟随第一个事件,我必须更改状态。例如用户在 100 分钟内没有退出,认为他处于无效状态。如何使用当前的模式操作来设计它?

目前无法做到这一点。解决方案是有一个超时处理程序,只要事件序列因超出定义的时间 window 而被丢弃,就会触发该超时处理程序。已经有一个跟踪 timeout handler 实施的 JIRA 问题。

因为这个已经实现了,所以我想为那些来这里寻找答案的人回答这个问题。

从 Flink 1.0.0 开始,这可以通过处理超时模式来完成,例如,如果您的 CEP 模式是这样的:

示例部分来自 Flink Website(1.2 和 1.3 之间有一些重大变化,请相应地调整您的代码,此答案主要针对 1.3)

Pattern description: - Get first event of type "error", followed by a second event event of type "critical" within 10 seconds

Pattern<Event, ?> pattern = Pattern.<Event>begin("start")
.next("middle").where(new SimpleCondition<Event>() {
    @Override
    public boolean filter(Event value) throws Exception {
        return value.getName().equals("error");
    }
}).followedBy("end").where(new SimpleCondition<Event>() {
    @Override
    public boolean filter(Event value) throws Exception {
        return value.getName().equals("critical");
    }
}).within(Time.seconds(10));

PatternStream<BAMEvent> patternStream = CEP.pattern(inputStream, pattern)

DataStream<Either<String, String>> result = patternStream.select(new PatternTimeoutFunction<Event, String>() {
  @Override
  public String timeout(Map<String, List<Event>> map, long l) throws Exception {
    return map.toString() +" @ "+ l;
  }
}, new PatternSelectFunction<Event, String>() {

  @Override
  public String select(Map<String, List<Event>> map) throws Exception {
    return map.toString();
  }
});

对于这种情况,如果用户在 100 分钟后仍未注销,则由于相应的事件不会到达,这将导致模式超时,部分事件(启动事件)将被在 PatternTimeoutFunction 中捕获。