Slurm sinfo CPU 负载的单位

Units for Slurm sinfo CPU Load

我可以使用 sinfo 命令查看集群上所有节点的“CPU 负载”:

sinfo --Node --format="%10N %.6D %10P %10T %20E %.4c %.8z %8O %.6m %10e %.6w %.60f"

那里的 %8O 要求测量 CPU 负载,即八个字符宽。这个命令的问题是 manual doesn't say 单位是什么。它只是说“CPU 一个节点的负载。”这是百分比吗?每个 CPU 的进程数?每个线程的进程数?完全承诺的等效数量 CPUs/threads?

在 Linux 上下文中,CPU 负载具有与正在执行或待执行的进程数相关的特定定义(即请求 CPU 但无法访问它。)

通常会考虑短时间内的平均负载;这就是计算负载的各种命令可以报告小数的原因。

负载 0 表示没有 activity,负载 1 表示相当于 1 CPU 核心在所考虑的时间段内处于 100% 活跃状态,或者两个核心处于 50% 活跃状态,等等. 这可能是由于一个进程是 CPU bound, or two processes being I/O bound 例如。

负载大于机器中CPU个内核的数量表示许多进程正在争夺CPU个资源并且context switching发生。

负载等于机器中 CPU 个内核的数量表示所有内核在 100% 的时间内都处于忙碌状态,这正是 HPC 集群所期望的。大多数情况下,进程是 pinned to their "own" core

有关详细信息,请参阅 here