SLURM 的 sinfo 显示混合状态而不是分配状态
SLURM's sinfo displays mixed instead of allocated state
我正在使用 SLURM 作业管理器在 Linux 集群 运行 Ubuntu 服务器 14.04.3 中调度作业。我注意到 sinfo 以混合模式报告所有节点,无论它们是部分分配还是完全分配;空闲节点被正确报告为空闲。以下是 sinfo 命令的输出:
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
compute* up infinite 5 mix node[01-05]
compute* up infinite 1 idle node06
但是,node04 已完全分配,因此其状态应由 sinfo 报告为 alloc,而 node03 已部分分配,如使用 scontrol 命令所示:
scontrol show node node04
CPUAlloc=6 CPUErr=0 CPUTot=6 CPULoad=6.01 Features=(null)
Gres=(null)
NodeAddr=node04 NodeHostName=node04
OS=Linux RealMemory=64333 AllocMem=0 Sockets=1 Boards=1
State=ALLOCATED ThreadsPerCore=1 TmpDisk=0 Weight=1
BootTime=2016-04-11T16:38:52 SlurmdStartTime=2016-04-11T16:39:59
CurrentWatts=0 LowestJoules=0 ConsumedJoules=0
ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/s
scontrol show node node03
CPUAlloc=1 CPUErr=0 CPUTot=6 CPULoad=1.01 Features=(null)
Gres=(null)
NodeAddr=node03 NodeHostName=node03
OS=Linux RealMemory=64333 AllocMem=0 Sockets=1 Boards=1
State=MIXED ThreadsPerCore=1 TmpDisk=0 Weight=1
BootTime=2016-04-11T16:38:38 SlurmdStartTime=2016-04-11T16:39:08
CurrentWatts=0 LowestJoules=0 ConsumedJoules=0
ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/s
sinfo 有什么问题?
提前感谢您的任何建议!
万一其他人有问题,这在几年前就已经解决了:
我正在使用 SLURM 作业管理器在 Linux 集群 运行 Ubuntu 服务器 14.04.3 中调度作业。我注意到 sinfo 以混合模式报告所有节点,无论它们是部分分配还是完全分配;空闲节点被正确报告为空闲。以下是 sinfo 命令的输出:
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
compute* up infinite 5 mix node[01-05]
compute* up infinite 1 idle node06
但是,node04 已完全分配,因此其状态应由 sinfo 报告为 alloc,而 node03 已部分分配,如使用 scontrol 命令所示:
scontrol show node node04
CPUAlloc=6 CPUErr=0 CPUTot=6 CPULoad=6.01 Features=(null)
Gres=(null)
NodeAddr=node04 NodeHostName=node04
OS=Linux RealMemory=64333 AllocMem=0 Sockets=1 Boards=1
State=ALLOCATED ThreadsPerCore=1 TmpDisk=0 Weight=1
BootTime=2016-04-11T16:38:52 SlurmdStartTime=2016-04-11T16:39:59
CurrentWatts=0 LowestJoules=0 ConsumedJoules=0
ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/s
scontrol show node node03
CPUAlloc=1 CPUErr=0 CPUTot=6 CPULoad=1.01 Features=(null)
Gres=(null)
NodeAddr=node03 NodeHostName=node03
OS=Linux RealMemory=64333 AllocMem=0 Sockets=1 Boards=1
State=MIXED ThreadsPerCore=1 TmpDisk=0 Weight=1
BootTime=2016-04-11T16:38:38 SlurmdStartTime=2016-04-11T16:39:08
CurrentWatts=0 LowestJoules=0 ConsumedJoules=0
ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/s
sinfo 有什么问题?
提前感谢您的任何建议!
万一其他人有问题,这在几年前就已经解决了: