使用 Flink Prometheus PushGateway Reporter 发生 OOM

Use Flink Prometheous PushGateway Repoter but happened OOM

FLink版本是1.12,我按照步骤(https://ci.apache.org/projects/flink/flink-docs-release-1.12/deployment/metric_reporters.html#prometheuspushgateway-orgapacheflinkmetricsprometheusprometheuspushgatewayreporter),填写我的配置,运行我在Flink集群中的工作。但几个小时后,我发现在 grafana 上看不到指标数据,所以我登录服务器并查看 pushgateway 日志,找到类似“内存不足”的错误日志。

我不明白,实际上我设置了 deleteOnShutdown=true 并且我的一些工作被关闭了。为什么pushgateway会OOM?

这个问题一直存在,但是在之前的v1.13文档中没有描述。您可以查看 pull request 以获取更多信息。

如果你想在你的Flink集群中使用push模型,我推荐使用influxdb。