Prometheus error: couldn't load configuration. Found multiple scrape configs

Prometheus error: couldn't load configuration. Found multiple scrape configs

正如标题所说,我 运行 遇到了 prometheus 异常,但不知道如何修复它。

我们使用这样的 BOSH 部署:

bosh -d prometheus deploy -n prometheus.yml \
-o prometheus-boshrelease/manifests/operators/monitor-concourse.yml \
-o prometheus-boshrelease/manifests/operators/monitor-bosh.yml \
...

然后我们像这样进行清单更新:

- type: replace
path: /instance_groups/name=prometheus2/jobs/name=prometheus2/properties/prometheus/scrape_configs/-
value:
  job_name: concourse
  scrape_interval: 2m
  scrape_timeout: 1m
  static_configs:
    - targets:
      - 192.168.123.123:9391

在部署过程中,我们收到一条错误消息,指出 prometheus2 实例不是 运行。在 prometheus.stderr.log 中,我发现了错误消息:

found multiple scrape configs with job name \"concourse\"

如何让 bosh 和 concourse 出口商一起工作?这与我的清单修改有关吗?寻找任何想法,谢谢!

您已经通过应用操作文件 monitor-bosh.yml 添加了此抓取配置。 https://github.com/bosh-prometheus/prometheus-boshrelease/blob/master/manifests/operators/monitor-bosh.yml#L199-L219

这样可以自动发现您的 concourse 部署(如果 concourse 也由 bosh 部署)。

如果您不想使用自动发现,而是静态配置您的大厅端点(尽管我不推荐这样做),您必须先从您的部署中删除我链接的部分。 这可以通过这样的操作文件来完成(未测试):

- type: remove
  path: /instance_groups/name=prometheus2/jobs/name=prometheus2/properties/prometheus/scrape_configs/job_name=concourse?

必须先应用它,然后才能应用您的更改。