为什么我“开始”的工作比 运行 或暂停的工作多得多?

Why do I have many more jobs `started` than running or suspended?

根据 bqueues 手册页:

STARTED
         Number of job slots used by running or
         suspended jobs owned by users or user groups in
         the queue.

根据bqueues,我已经开始了 369 个工作:

$ bqueues -r lotus | egrep '(STARTED|gholl)'
 USER/GROUP   SHARES  PRIORITY  STARTED  RESERVED  CPU_TIME  RUN_TIME   ADJUST
gholl          10       0.006    369        0   2334366.5   723589       0.000

但是当我 运行 bjobs 时,它只显示 24 个正在 运行ning 或暂停的作业:

$ bjobs | egrep '(RUN|SUSP)' | wc -l
24

如何解释 运行ning 的 24 个工作和 369 个工作之间的差异?

STARTED中的数字是指槽数。如果一个作业使用多个线程,它可能会占用多个槽。例如,如果使用带有标志 -n 16bsubs 提交作业,则每个作业将使用 16 个作业。 23×16+1=368,因此在上面的示例中,用户 gholl 有 23 个作业使用 16 个槽,1 个作业使用 1 个槽。