Azure 流分析:"Output contains multiple rows …" 警告

Azure Stream Analytics: "Output contains multiple rows …" warning

我们在 Azure 中使用流分析组件将数据(来自不同网络应用程序的日志消息)发送到 table 存储帐户。消息是从事件中心检索的,但我认为这在这里无关紧要。

在流分析组件中,我们为 table 存储帐户定义了一个输出,包括分区和行键设置。到目前为止,分区键将是首先发送日志消息的应用程序的名称。这可能并不理想,但我缺乏在这里选择正确值的经验。但是,我认为这是一个完全不同的话题。行键将是特定日志消息的唯一 ID。

现在,当我在 Azure 门户中查看流分析输出时,会非常频繁地弹出以下警告消息(有时会消失几秒钟):

Warning: Output contains multiple rows and just one row per partition key. If the output latency is higher than expected, consider choosing a partition key that splits output into multiple partitions while maintaining about 100 records per partition.

关于这条消息,我有两个问题:

  1. 这到底是什么意思,或者为什么会这样?我可以看到一条新的日志消息总是符合 "just one row per partition key",因为它只是一行。但是看看在短时间内发送的数百行,它们都只共享三个分区键(三个应用程序登录到事件中心),几乎平均分配。这就是为什么我不明白整个 "Output contains multiple rows and just one row per partition key" 的原因。
  2. 这会以任何方式影响流分析组件或 table 存储的性能或整体功能吗?

我还尝试了 table 存储输出的 "Batch size" 设置,但这并没有改变任何东西。

在此先感谢您阅读并尝试提供帮助。

What does this exactly mean or why does it happen?

这是警告,不是错误。这意味着输出中的每一行都有唯一的分区键。

I can see that a single new log message will always qualify as "just one row per partition key", simply because it's just one row.

该警告不适用于单个消息。我建议你 post 在 Azure 反馈站点上进行反馈,该站点用于接受用户意见和错误。

https://feedback.azure.com/forums/34192--general-feedback

Does this in any way affect the performance or overall functionality of the Stream Analytics component or the table storage?

不,您可以忽略警告。