使用 Icinga2 监控故障转移集群角色
Monitor Failovercluster roles with Icinga2
我正在使用 Icinga2
和 NSClient++
我有一个 PowerShell
检查每个 cluster node
上安装的某些集群角色。
如果集群角色失败,所有 cluster nodes
将发送相同的通知,这将导致仅针对一个实际服务问题的大量垃圾邮件。
只在一个集群节点上安装检查是没有选择的,因为它会产生角色监控的单点故障:失败的集群节点不应该影响集群角色(除了短暂的超时)但我不会能够在任何集群角色关闭后立即检查它。
是否可以将 service
分配给 hostgroup
,如果此服务失败,将只发送一个通知?
我最终让检查本身检查他是否应该将问题报告为关键问题(节点本身的服务失败)或 warning/ok(另一个节点上的服务失败)。
我正在使用 Icinga2
和 NSClient++
我有一个 PowerShell
检查每个 cluster node
上安装的某些集群角色。
如果集群角色失败,所有 cluster nodes
将发送相同的通知,这将导致仅针对一个实际服务问题的大量垃圾邮件。
只在一个集群节点上安装检查是没有选择的,因为它会产生角色监控的单点故障:失败的集群节点不应该影响集群角色(除了短暂的超时)但我不会能够在任何集群角色关闭后立即检查它。
是否可以将 service
分配给 hostgroup
,如果此服务失败,将只发送一个通知?
我最终让检查本身检查他是否应该将问题报告为关键问题(节点本身的服务失败)或 warning/ok(另一个节点上的服务失败)。