Flink 指标“flink_taskmanager_Status_JVM_CPU_Load{}”在 Grafana 仪表板中不准确
Flink metric `flink_taskmanager_Status_JVM_CPU_Load{}` is not accurate in Grafana Dashboard
我有一个简单的 Flink 作业,Kafka 的消费率是 5,000/s.
- 平行度:1
- 作业管理器:1 GB
- 任务管理器:2 GB
- Flink 版本:1.10.2
但据我观察,CPU 使用率太低。所以我认为,如果有可能,在这个版本中,Flink 指标是不准确的。或者可能是因为我配置了错误的 PromQL?
查询 Grafana 图表:
flink_jobmanager_Status_JVM_CPU_Load{exported_job='${jobmanager_prome_job}'}
更新任务管理器图表。
从您的标题来看,您实际上是想检查任务管理器上的负载(无论如何在大多数情况下这更有趣)。您能否调整您的 Grafana 图表以使用 taskmanager 而不是 jobmanager 并报告回来?请注意,仅当该机器上的所有内核都完全饱和时,CPU 才为 1。因此,如果您的机器中有 10 个内核,如果您 运行 的并行度为 1.
,那么您最多可以获得 0.1 个内核
我有一个简单的 Flink 作业,Kafka 的消费率是 5,000/s.
- 平行度:1
- 作业管理器:1 GB
- 任务管理器:2 GB
- Flink 版本:1.10.2
但据我观察,CPU 使用率太低。所以我认为,如果有可能,在这个版本中,Flink 指标是不准确的。或者可能是因为我配置了错误的 PromQL?
查询 Grafana 图表:
flink_jobmanager_Status_JVM_CPU_Load{exported_job='${jobmanager_prome_job}'}
更新任务管理器图表。
从您的标题来看,您实际上是想检查任务管理器上的负载(无论如何在大多数情况下这更有趣)。您能否调整您的 Grafana 图表以使用 taskmanager 而不是 jobmanager 并报告回来?请注意,仅当该机器上的所有内核都完全饱和时,CPU 才为 1。因此,如果您的机器中有 10 个内核,如果您 运行 的并行度为 1.
,那么您最多可以获得 0.1 个内核