Ambari 显示服务已停止
Ambari shows service as stopped
我们使用 Hortonworks HDP 2.1 和 Ambari 1.6.1
在我们的底层硬件崩溃后,我们几天前重新启动了我们的集群。我们再次恢复了一切,但是,Ambari 显示两个服务仍然关闭,YARN 资源管理器和 MapReduce 历史服务器。这两项服务都是 运行,通过检查服务器上的 运行 进程以及检查提供的功能来验证。 Nagios 健康检查也可以。尽管如此,Ambari 仍将服务显示为已停止。尝试启动它们不起作用(地址已在使用中,这是可以预料的,因为它已经是 运行)。如果进程在启动前被杀死,那么它会启动,但仍然会显示为失败操作,Ambari 将继续显示服务已停止。
其他人以前遇到过类似的问题吗?我在任何地方都找不到有关类似案例的任何信息。
我过去遇到过类似的问题,这是由于 PID 文件的权限问题。查看 YARN 的服务描述符文件,看看它检查了哪些文件以查看它是否 运行。通常它会读取 pid 并检查 pid 文件中列出的进程是否为 运行。我会发现它检查的 pid 文件的位置,然后停止服务,删除 pid 文件,然后使用 ambari 重新启动服务。这应该会重新创建具有正确 user/group 和权限的 pid 文件,并最终解决您所看到的问题。
我们使用 Hortonworks HDP 2.1 和 Ambari 1.6.1
在我们的底层硬件崩溃后,我们几天前重新启动了我们的集群。我们再次恢复了一切,但是,Ambari 显示两个服务仍然关闭,YARN 资源管理器和 MapReduce 历史服务器。这两项服务都是 运行,通过检查服务器上的 运行 进程以及检查提供的功能来验证。 Nagios 健康检查也可以。尽管如此,Ambari 仍将服务显示为已停止。尝试启动它们不起作用(地址已在使用中,这是可以预料的,因为它已经是 运行)。如果进程在启动前被杀死,那么它会启动,但仍然会显示为失败操作,Ambari 将继续显示服务已停止。
其他人以前遇到过类似的问题吗?我在任何地方都找不到有关类似案例的任何信息。
我过去遇到过类似的问题,这是由于 PID 文件的权限问题。查看 YARN 的服务描述符文件,看看它检查了哪些文件以查看它是否 运行。通常它会读取 pid 并检查 pid 文件中列出的进程是否为 运行。我会发现它检查的 pid 文件的位置,然后停止服务,删除 pid 文件,然后使用 ambari 重新启动服务。这应该会重新创建具有正确 user/group 和权限的 pid 文件,并最终解决您所看到的问题。