pbs_mom 重新启动 Linux 工作站时与日志文件相关的问题
pbs_mom problems related to log files when rebooting a Linux workstation
我在启动我们的一个工作站时遇到一些问题,我认为这与 TORQUE 资源管理器有关。
(CentOS上的扭矩服务器是运行,RedHat上的工作站)
抱歉,我可能无法更准确地解释问题,但我目前缺乏进一步缩小问题范围的知识和技能。简单介绍一下这个问题的背景:我们最近在周末停电,持续时间比备用电池持续时间长。因此,基本上每个工作站以及 NIS 主站和从站都已关闭。不幸的是,我们的系统管理员上个月永远离开了,我只是想让机器恢复正常 运行。由于
,仅剩一台工作站无法启动
pbs_mom: LOG_ERROR::read_config, config[19] special command log_file_role_depth failed with = 5
到目前为止,我在网上搜索了解决方案并尝试了不同的方法:
- 正在扭矩服务器上重新启动 pbs_mom
- 正在清除日志文件
- 正在修复扭矩相关目录中的权限
但是,我对 mom_priv/config
文件本身的 log_file_role_depth=5
设置感到疑惑。看起来这不是一个有效的命令?!我试图将其更改为 ...=1
并甚至将其完全注释掉,但是,之后机器会在不同的步骤重新启动时卡住,我无法判断是哪个导致了这个问题:
(以上截图来自工作站,非扭矩服务器)
扭矩服务器上似乎也存在相关问题。例如,如果我终止 pbs_mom
进程并通过
重新启动它
pbs_mom -p
我收到相同的日志文件错误,但是 pbs_mom 进程此后是 运行。
有什么想法或建议接下来要尝试什么吗?我非常感谢任何反馈,由于我缺乏系统管理员技能,我在这里真的有点迷路。
此消息表示处理妈妈的配置文件时出错。它位于 /mom_priv/config。默认情况下,这是 /var/spool/torque/mom_priv/config。从错误消息来看,您的文件似乎有:
$log_file_roll_depth = 5
你想要它没有等号:
$log_file_roll_depth 5
我在启动我们的一个工作站时遇到一些问题,我认为这与 TORQUE 资源管理器有关。
(CentOS上的扭矩服务器是运行,RedHat上的工作站)
抱歉,我可能无法更准确地解释问题,但我目前缺乏进一步缩小问题范围的知识和技能。简单介绍一下这个问题的背景:我们最近在周末停电,持续时间比备用电池持续时间长。因此,基本上每个工作站以及 NIS 主站和从站都已关闭。不幸的是,我们的系统管理员上个月永远离开了,我只是想让机器恢复正常 运行。由于
,仅剩一台工作站无法启动pbs_mom: LOG_ERROR::read_config, config[19] special command log_file_role_depth failed with = 5
到目前为止,我在网上搜索了解决方案并尝试了不同的方法:
- 正在扭矩服务器上重新启动 pbs_mom
- 正在清除日志文件
- 正在修复扭矩相关目录中的权限
但是,我对 mom_priv/config
文件本身的 log_file_role_depth=5
设置感到疑惑。看起来这不是一个有效的命令?!我试图将其更改为 ...=1
并甚至将其完全注释掉,但是,之后机器会在不同的步骤重新启动时卡住,我无法判断是哪个导致了这个问题:
(以上截图来自工作站,非扭矩服务器)
扭矩服务器上似乎也存在相关问题。例如,如果我终止 pbs_mom
进程并通过
pbs_mom -p
我收到相同的日志文件错误,但是 pbs_mom 进程此后是 运行。
有什么想法或建议接下来要尝试什么吗?我非常感谢任何反馈,由于我缺乏系统管理员技能,我在这里真的有点迷路。
此消息表示处理妈妈的配置文件时出错。它位于 /mom_priv/config。默认情况下,这是 /var/spool/torque/mom_priv/config。从错误消息来看,您的文件似乎有:
$log_file_roll_depth = 5
你想要它没有等号:
$log_file_roll_depth 5