Namenode 正常运行时间指标 Ambari 服务器

Namenode uptime metric Ambari server

我在 HDInsights 上有一个 Spark 集群 运行。 Ambari 在其仪表板中显示了一些通用指标,例如 Namenode 正常运行时间 。 Where/How 我可以找到与该指标相关的原始数据吗?

谢谢

Ambari 代理可能正在使用 os.system() python 调用。你可以用

做同样的事情

ssh user@node -c "uptime"

您应该“启用 HDInsight Azure Monitor 日志集成”以查找与 Ambari 中可用的任何指标相关的原始数据UI。

Using Ambari Dashboard:

Ambari 仪表板,其中包含显示少量指标的小部件,可让您快速了解 HDInsight 群集的运行状况。这些小部件显示诸如活动 DataNode(工作节点)和 JournalNode(zookeeper 节点)、NameNode(头节点)uptime 等指标,以及特定于某些集群类型的指标,例如 YARN Spark 和 Hadoop 集群的 ResourceManager 正常运行时间。

Using Azure Monitor:

Azure Monitor 日志可以将多个资源(例如 HDInsight 集群)生成的数据收集并聚合在一个地方,以实现统一的监控体验。

As a prerequisite, you'll need a Log Analytics Workspace to store the collected data. If you haven't already created one, you can follow instructions here: Create a Log Analytics Workspace.

HDInsight 集群包括 Azure Monitor 日志集成,它提供可查询的指标和日志,以及可配置的警报。本文显示 how to use Azure Monitor to monitor your cluster.

例如,运行 可用率 示例查询,方法是在该查询上选择 运行,如上面的屏幕截图所示。这将以百分比形式显示集群中每个节点的可用率。如果你已启用多个 HDInsight 群集以将指标发送到同一 Log Analytics 工作区,你将看到显示这些群集中所有节点的可用性率。