pbs_mom 重新启动 Linux 工作站时与日志文件相关的问题

pbs_mom problems related to log files when rebooting a Linux workstation

我在启动我们的一个工作站时遇到一些问题,我认为这与 TORQUE 资源管理器有关。

(CentOS上的扭矩服务器是运行,RedHat上的工作站)

抱歉,我可能无法更准确地解释问题,但我目前缺乏进一步缩小问题范围的知识和技能。简单介绍一下这个问题的背景:我们最近在周末停电,持续时间比备用电池持续时间长。因此,基本上每个工作站以及 NIS 主站和从站都已关闭。不幸的是,我们的系统管理员上个月永远离开了,我只是想让机器恢复正常 运行。由于

,仅剩一台工作站无法启动

pbs_mom: LOG_ERROR::read_config, config[19] special command log_file_role_depth failed with = 5

到目前为止,我在网上搜索了解决方案并尝试了不同的方法:

但是,我对 mom_priv/config 文件本身的 log_file_role_depth=5 设置感到疑惑。看起来这不是一个有效的命令?!我试图将其更改为 ...=1 并甚至将其完全注释掉,但是,之后机器会在不同的步骤重新启动时卡住,我无法判断是哪个导致了这个问题:

(以上截图来自工作站,非扭矩服务器)

扭矩服务器上似乎也存在相关问题。例如,如果我终止 pbs_mom 进程并通过

重新启动它
pbs_mom -p

我收到相同的日志文件错误,但是 pbs_mom 进程此后是 运行。

有什么想法或建议接下来要尝试什么吗?我非常感谢任何反馈,由于我缺乏系统管理员技能,我在这里真的有点迷路。

此消息表示处理妈妈的配置文件时出错。它位于 /mom_priv/config。默认情况下,这是 /var/spool/torque/mom_priv/config。从错误消息来看,您的文件似乎有:

$log_file_roll_depth = 5

你想要它没有等号:

$log_file_roll_depth 5