具有事件中心输入流位置的 Azure 流分析
Azure streaming analytics with event hub input stream position
设置
我使用 Azure 流分析将数据流式传输到 Azure 仓库暂存 table。
作业的输入源是 EventHub 流。
我注意到当我更新作业时,作业输入事件积压在开始后大量增加。
看起来作业又从头开始处理完整的 EventHub 队列了。
问题
- 流分析中的流位置管理是如何组织的
- 是否可以定义作业开始的流位置(例如,在特定时间点后排队的事件)
至此完成
我注意到一个类似的问题。
提到了一个变量名"eventStartTime"。
但是由于我在 visual studio 中使用 "asaproj" 项目来创建、更新和部署作业,所以我不知道在部署之前将它放在哪里。
为了不间断地更新作业,它会使用之前设置的“Joboutputstarttime”,所以作业启动可以从头开始处理数据。
您可以先停止作业,然后在开始作业之前选择“Joboutputstarttime”。
您可以参考此文档 https://docs.microsoft.com/en-us/azure/stream-analytics/start-job 以查看每种模式的详细信息。对于您的场景,“上次停止时”模式可能是您需要的模式,它不会从 eventhub 队列的开头处理数据。
设置
我使用 Azure 流分析将数据流式传输到 Azure 仓库暂存 table。 作业的输入源是 EventHub 流。 我注意到当我更新作业时,作业输入事件积压在开始后大量增加。 看起来作业又从头开始处理完整的 EventHub 队列了。
问题
- 流分析中的流位置管理是如何组织的
- 是否可以定义作业开始的流位置(例如,在特定时间点后排队的事件)
至此完成
我注意到一个类似的问题
为了不间断地更新作业,它会使用之前设置的“Joboutputstarttime”,所以作业启动可以从头开始处理数据。
您可以先停止作业,然后在开始作业之前选择“Joboutputstarttime”。
您可以参考此文档 https://docs.microsoft.com/en-us/azure/stream-analytics/start-job 以查看每种模式的详细信息。对于您的场景,“上次停止时”模式可能是您需要的模式,它不会从 eventhub 队列的开头处理数据。