Azure 流分析:"Output contains multiple rows …" 警告
Azure Stream Analytics: "Output contains multiple rows …" warning
我们在 Azure 中使用流分析组件将数据(来自不同网络应用程序的日志消息)发送到 table 存储帐户。消息是从事件中心检索的,但我认为这在这里无关紧要。
在流分析组件中,我们为 table 存储帐户定义了一个输出,包括分区和行键设置。到目前为止,分区键将是首先发送日志消息的应用程序的名称。这可能并不理想,但我缺乏在这里选择正确值的经验。但是,我认为这是一个完全不同的话题。行键将是特定日志消息的唯一 ID。
现在,当我在 Azure 门户中查看流分析输出时,会非常频繁地弹出以下警告消息(有时会消失几秒钟):
Warning: Output contains multiple rows and just one row per partition key. If the output latency is higher than expected, consider choosing a partition key that splits output into multiple partitions while maintaining about 100 records per partition.
关于这条消息,我有两个问题:
- 这到底是什么意思,或者为什么会这样?我可以看到一条新的日志消息总是符合 "just one row per partition key",因为它只是一行。但是看看在短时间内发送的数百行,它们都只共享三个分区键(三个应用程序登录到事件中心),几乎平均分配。这就是为什么我不明白整个 "Output contains multiple rows and just one row per partition key" 的原因。
- 这会以任何方式影响流分析组件或 table 存储的性能或整体功能吗?
我还尝试了 table 存储输出的 "Batch size" 设置,但这并没有改变任何东西。
在此先感谢您阅读并尝试提供帮助。
What does this exactly mean or why does it happen?
这是警告,不是错误。这意味着输出中的每一行都有唯一的分区键。
I can see that a single new log message will always qualify as "just one row per partition key", simply because it's just one row.
该警告不适用于单个消息。我建议你 post 在 Azure 反馈站点上进行反馈,该站点用于接受用户意见和错误。
https://feedback.azure.com/forums/34192--general-feedback
Does this in any way affect the performance or overall functionality of the Stream Analytics component or the table storage?
不,您可以忽略警告。
我们在 Azure 中使用流分析组件将数据(来自不同网络应用程序的日志消息)发送到 table 存储帐户。消息是从事件中心检索的,但我认为这在这里无关紧要。
在流分析组件中,我们为 table 存储帐户定义了一个输出,包括分区和行键设置。到目前为止,分区键将是首先发送日志消息的应用程序的名称。这可能并不理想,但我缺乏在这里选择正确值的经验。但是,我认为这是一个完全不同的话题。行键将是特定日志消息的唯一 ID。
现在,当我在 Azure 门户中查看流分析输出时,会非常频繁地弹出以下警告消息(有时会消失几秒钟):
Warning: Output contains multiple rows and just one row per partition key. If the output latency is higher than expected, consider choosing a partition key that splits output into multiple partitions while maintaining about 100 records per partition.
关于这条消息,我有两个问题:
- 这到底是什么意思,或者为什么会这样?我可以看到一条新的日志消息总是符合 "just one row per partition key",因为它只是一行。但是看看在短时间内发送的数百行,它们都只共享三个分区键(三个应用程序登录到事件中心),几乎平均分配。这就是为什么我不明白整个 "Output contains multiple rows and just one row per partition key" 的原因。
- 这会以任何方式影响流分析组件或 table 存储的性能或整体功能吗?
我还尝试了 table 存储输出的 "Batch size" 设置,但这并没有改变任何东西。
在此先感谢您阅读并尝试提供帮助。
What does this exactly mean or why does it happen?
这是警告,不是错误。这意味着输出中的每一行都有唯一的分区键。
I can see that a single new log message will always qualify as "just one row per partition key", simply because it's just one row.
该警告不适用于单个消息。我建议你 post 在 Azure 反馈站点上进行反馈,该站点用于接受用户意见和错误。
https://feedback.azure.com/forums/34192--general-feedback
Does this in any way affect the performance or overall functionality of the Stream Analytics component or the table storage?
不,您可以忽略警告。