SCOM 2019 - Windows Server 2012 集群监控问题

SCOM 2019 - Windows Server 2012 Cluster monitoring issue

我正在测试 SCOM 2019 并观察到该产品可能已损坏 - 无法监控 Windows Server 2012 R2 集群。当我尝试添加集群节点时,整个 SCOM 2019 都失败了,电子邮件未发送,配置未正确应用。有信息表明某些 CAST 无效但没有任何详细信息(我推测某些 SQL 数据无法转换)。 SCOM 2019 无法正确发现集群资源并将其添加到无代理管理中。我尝试修改 .config 文件并将超时延长至 300(如其他一些论坛中所述),将 SCOM SQL 2019 数据库的兼容级别更改为较低(2012,2014,2016),重新安装 SCOM 代理集群节点。什么都不管用。在SCOM 2019 Health Service SQL Table中,节点集群的许多列都为NULL,并且SQL集群名称等集群资源可见或不可见(随机)。就像 SCOM 2019 无法正确发现集群资源一样。看起来 SCOM 2019 已经作为损坏的产品交付生产。我已联系 Microsoft 支持,但目前他们无法解决问题。而且他们无法根据要求为此准备修补程序,因为我不是 PREMIER MS 客户:(非常欢迎任何解决此问题的想法。

我已经解决了这个问题。 SCOM 2019 无法监控 Windows Server 2012 R2 Windows 集群(可能还有其他版本的 Windows 服务器集群)的问题实际上不在 SCOM 2019 本身,而是在 BROKEN/INCOMPATIBLE "Windows Server Branch Cache Management Pack" 中。我不知道为什么 - Branch Cache 与 Windows Clusters 有什么共同点 - 但它看起来就是这样。因此,如果您观察到 SCOM 2019 已挂起并且未发送任何电子邮件,在添加要监视的集群时未应用任何配置,并且集群监视本身无法正常工作,那么首先 "uninstall/delete all "Branch Cache" 相关管理包来自SCOM 2019(我有 2 个 - Windows Server Branch Cache 和 reporting Branch Cache MP),接下来停止群集节点上的 SCOM 代理,然后手动删除文件夹 "Health Service State"(从 C:\Program Files\Microsoft监控Agent/Agent),接下来启动SCOM Agent服务(文件夹会自动重新创建),接下来进入SCOM Console\Operations Manager\Agents Health State,接下来选择agents on适当的集群节点(一个接一个)并从任务窗格中单击 "Clear/Flush cachen ane agent health state"。在 10-20 分钟内,集群节点将在 SCOM 2019 监控中正确可见,并且集群资源将在 Agentless 中正确可见监控。