流分析恢复行为

Stream analytics resume behavior

我有一个 EventHub 流作为输入,一个 Service Bus Queue 作为输出。

我的查询使用 TUMBLINGWINDOW 聚合事件以从流输出到队列。

如果我必须暂停 Stream Analytics 并稍后从停止点恢复它,这是否意味着我的数据 windows 现在将被延迟?或者它会在第一个 window?

中赶上最后一个停止日期和现在之间的事件

E.G. 我停止分析一个小时,然后从停止点恢复,所以从现在开始,它将始终在一小时后处理新事件。

我停止分析一个小时,然后从停止点恢复,第一个输出将包含一个小时前到现在的数据,新的 windows 将实时处理新数据。

由于流分析将从它停止的地方继续读取数据,它会立即摄取所有它可以获取的数据,并在完成所有数据后几乎立即开始生成实时数据暂停后出现。

我在创建流分析作业时也在想同样的事情。第一次启动作业时,作业输出开始时间只有 2 个选项,即现在和自定义。

但是当您在第一次之后开始作业时,您会得到另一个选项:上次停止时。

To resume a stopped job without losing data, choose Last stopped (note that this option isn't available if you're running a job for the first time).