使用 Icinga2 监控故障转移集群角色

Monitor Failovercluster roles with Icinga2

我正在使用 Icinga2NSClient++

我有一个 PowerShell 检查每个 cluster node 上安装的某些集群角色。 如果集群角色失败,所有 cluster nodes 将发送相同的通知,这将导致仅针对一个实际服务问题的大量垃圾邮件。

只在一个集群节点上安装检查是没有选择的,因为它会产生角色监控的单点故障:失败的集群节点不应该影响集群角色(除了短暂的超时)但我不会能够在任何集群角色关闭后立即检查它。

是否可以将 service 分配给 hostgroup,如果此服务失败,将只发送一个通知?

我最终让检查本身检查他是否应该将问题报告为关键问题(节点本身的服务失败)或 warning/ok(另一个节点上的服务失败)。