为什么我“开始”的工作比 运行 或暂停的工作多得多?
Why do I have many more jobs `started` than running or suspended?
根据 bqueues
手册页:
STARTED
Number of job slots used by running or
suspended jobs owned by users or user groups in
the queue.
根据bqueues
,我已经开始了 369 个工作:
$ bqueues -r lotus | egrep '(STARTED|gholl)'
USER/GROUP SHARES PRIORITY STARTED RESERVED CPU_TIME RUN_TIME ADJUST
gholl 10 0.006 369 0 2334366.5 723589 0.000
但是当我 运行 bjobs
时,它只显示 24 个正在 运行ning 或暂停的作业:
$ bjobs | egrep '(RUN|SUSP)' | wc -l
24
如何解释 运行ning 的 24 个工作和 369 个工作之间的差异?
STARTED
中的数字是指槽数。如果一个作业使用多个线程,它可能会占用多个槽。例如,如果使用带有标志 -n 16
的 bsubs
提交作业,则每个作业将使用 16 个作业。 23×16+1=368,因此在上面的示例中,用户 gholl
有 23 个作业使用 16 个槽,1 个作业使用 1 个槽。
根据 bqueues
手册页:
STARTED
Number of job slots used by running or
suspended jobs owned by users or user groups in
the queue.
根据bqueues
,我已经开始了 369 个工作:
$ bqueues -r lotus | egrep '(STARTED|gholl)'
USER/GROUP SHARES PRIORITY STARTED RESERVED CPU_TIME RUN_TIME ADJUST
gholl 10 0.006 369 0 2334366.5 723589 0.000
但是当我 运行 bjobs
时,它只显示 24 个正在 运行ning 或暂停的作业:
$ bjobs | egrep '(RUN|SUSP)' | wc -l
24
如何解释 运行ning 的 24 个工作和 369 个工作之间的差异?
STARTED
中的数字是指槽数。如果一个作业使用多个线程,它可能会占用多个槽。例如,如果使用带有标志 -n 16
的 bsubs
提交作业,则每个作业将使用 16 个作业。 23×16+1=368,因此在上面的示例中,用户 gholl
有 23 个作业使用 16 个槽,1 个作业使用 1 个槽。