数据收集代理 (DCA) 有未处理的异常

The Data Collection Agent (DCA) had an unhandled exception

我有一个全新的预置服务结构安装,上面没有任何应用程序 运行,只有基本服务。它对集群和远程通信使用 Windows 身份验证。 3 个节点中的 2 个立即进入故障状态并显示:

Error event: SourceId='FabricDCA', Property='DataCollectionAgent.'.

数据收集代理 (DCA) 有一个未处理的异常,将被停止。如果这种情况继续发生,将不会收集诊断信息。

这似乎是间歇性的,因为一个节点刚刚恢复。然后另一个会失败,即使是最开始工作的那个。以前有人 运行 参与过这个吗?另一个 post 看起来很相似,但没有答案:

The data collection agent dca had an unhandled exception and will be stopped

提前致谢。

我们发现网络服务无法访问 Service Fabric 日志记录位置。我们已经添加了它,但组策略一直在删除它。更新组策略后,此错误消失,集群稳定。

对于 Alter 的观点,我们使用 Microsoft Message Analyzer 查看日志,然后添加 ETW.ETWProviderMessage.EventRecord.Header.Descriptor.Level 列来查找错误。错误为 2 级,警告为 3 级。然后您可以按该列进行过滤或分组。执行此操作后,您需要经常使用围绕错误的 4 级信息性消息进行调试。

祝你好运,我正在沿着这条学习曲线前进... 格雷格