Linux Hadoop 服务监控工具,如果关闭则重新启动

Linux Hadoop Services monitoring tool and restart if down

我已经用 Hbase 配置了 Hadoop 2.7.5。它是一个完全分布式模式的 5 系统集群。我必须监视 Hadoop/Hbase 个守护进程,并希望在某些守护进程出现故障时启动一些操作(例如 mail )。有没有内置的解决方案。 我也想在启动时启动 Hadoop。我该怎么做?

我假设您没有使用像 Cloudera 或 Hortonworks 这样的主要发行版,他们的堆栈中内置了此功能。

要自动重启一次开机,可以使用init.d(或systemd)

以及失败时发送电子邮件的示例,此答案中有脚本解决方案 Bash script to monitor process and sendmail if failed

在企业组织中,大多数都会有一个监控解决方案,例如 tivoli,您可以连接到它。