是否有 Cadence 指标可以帮助发现每个特定 activity 工作人员的过载?
Is there a Cadence metric that can help spot overloads for each specific activity worker?
我的公司想根据任务列表的负载自动扩展 activity 个工作人员和每个工作流工作人员。
阅读文档后,我发现了 activity 名员工的以下指标:
- cadence_activity_scheduled_to_start_latency_bucket
- cadence_activity_scheduled_to_start_latency_count
- cadence_activity_scheduled_to_start_latency_sum
然而,这些似乎是 activity 工人的全球指标。是否有 Cadence 指标可以让我发现每个特定 activity 工作人员的过载?
示例:
我们有 4 个不同的 activity 工人:A、B、C 和 D
我们希望在不影响其他人的情况下独立扩展 A 或 B 或 C 或 D
了解scheduled_to_start_latency
scheduled_to_start_latency
是 worker 从计划到启动的时间度量。从计划到启动,任务从匹配服务转移到 activity 工作人员。
这些是延迟变高时的潜在热点:
- 匹配服务过热,无法派发任务 -- 这种情况需要与CPU/memory个匹配节点确认
- 任务列表超载,因为它默认有一个分区只映射到一个匹配节点:https://cadenceworkflow.io/docs/operation-guide/maintain/#scale-up-a-tasklist-using-scalable-tasklist-feature -- 在这种情况下,使用每秒任务指标来确认任务列表的任务速率
- activity 工作人员超载。
如何监控 activity 工作人员超载
- CPU/memory/Thread usage/Garbage activity worker 的集合通常足以确保 worker 不会超载
- 您也可以使用
scheduled_to_start_latency
,但高延迟可能意味着与上述不同的事情。使用其他指标来排除原因。
我的公司想根据任务列表的负载自动扩展 activity 个工作人员和每个工作流工作人员。
阅读文档后,我发现了 activity 名员工的以下指标:
- cadence_activity_scheduled_to_start_latency_bucket
- cadence_activity_scheduled_to_start_latency_count
- cadence_activity_scheduled_to_start_latency_sum
然而,这些似乎是 activity 工人的全球指标。是否有 Cadence 指标可以让我发现每个特定 activity 工作人员的过载?
示例: 我们有 4 个不同的 activity 工人:A、B、C 和 D 我们希望在不影响其他人的情况下独立扩展 A 或 B 或 C 或 D
了解scheduled_to_start_latency
scheduled_to_start_latency
是 worker 从计划到启动的时间度量。从计划到启动,任务从匹配服务转移到 activity 工作人员。
这些是延迟变高时的潜在热点:
- 匹配服务过热,无法派发任务 -- 这种情况需要与CPU/memory个匹配节点确认
- 任务列表超载,因为它默认有一个分区只映射到一个匹配节点:https://cadenceworkflow.io/docs/operation-guide/maintain/#scale-up-a-tasklist-using-scalable-tasklist-feature -- 在这种情况下,使用每秒任务指标来确认任务列表的任务速率
- activity 工作人员超载。
如何监控 activity 工作人员超载
- CPU/memory/Thread usage/Garbage activity worker 的集合通常足以确保 worker 不会超载
- 您也可以使用
scheduled_to_start_latency
,但高延迟可能意味着与上述不同的事情。使用其他指标来排除原因。