无法在 SGE 集群中 chdir 到 /path/to/job_submit_dir/
cannot chdir to /path/to/job_submit_dir/ in SGE cluster
我使用 qsub
向 SGE 集群提交作业。在作业文件中,定义了以下内容:
#!/bin/bash
#
#$ -V
#$ -cwd
#$ -j y
#$ -S /bin/bash
#
-cwd
表示作业将 运行 在作业文件所在的目录中。所有作业文件都包含上述作业设置。
部分作业已提交,可以运行正确,但其中一些已提交,qstat
的状态为Eqw
,使用时qstat -j job_id
显示详细状态,它显示:
failed changing into working directory because:
error: can't chdir to /path/to/job_submit_dir
但有时我会进入目录,然后重新提交作业,似乎可以。
我在Google中搜索过,this site提供了解决方案,但它不适用于我的设置。
谁能给点建议吗?
出现此错误问题的实例可能是由于对网络安装存储的写入过多:
https://www.icts.uiowa.edu/confluence/display/ICTSit/Best+practices+for+high+throughput+jobs
解决尝试将输出重定向到每个执行节点上的本地存储或 /dev/null
。
我使用 qsub
向 SGE 集群提交作业。在作业文件中,定义了以下内容:
#!/bin/bash
#
#$ -V
#$ -cwd
#$ -j y
#$ -S /bin/bash
#
-cwd
表示作业将 运行 在作业文件所在的目录中。所有作业文件都包含上述作业设置。
部分作业已提交,可以运行正确,但其中一些已提交,qstat
的状态为Eqw
,使用时qstat -j job_id
显示详细状态,它显示:
failed changing into working directory because:
error: can't chdir to /path/to/job_submit_dir
但有时我会进入目录,然后重新提交作业,似乎可以。
我在Google中搜索过,this site提供了解决方案,但它不适用于我的设置。
谁能给点建议吗?
出现此错误问题的实例可能是由于对网络安装存储的写入过多:
https://www.icts.uiowa.edu/confluence/display/ICTSit/Best+practices+for+high+throughput+jobs
解决尝试将输出重定向到每个执行节点上的本地存储或 /dev/null
。