在 Linux 集群中尝试 运行 代码时未找到 Matplotlib

Matplotlib not found when trying to run code in Linux cluster

我正在 运行ning 一个 Julia 脚本,同时通过 ssh 进入 Linux 集群。代码加载matplotlib如下:

import Distributed   
using Distributed  

@everywhere  pushfirst!(Base.DEPOT_PATH,"/tmp/test.cache")   
   
@everywhere import PyCall   
@everywhere import PyPlot   
@everywhere pyimport matplotlib.pyplot as mpl 

当我从终端 运行 我的代码工作正常。但是,当我通过 Torque 提交作业时,输出文件 can be found here, and appears to suggest that the code cannot find matplotlib.

我对上面的内容有点困惑。为什么我在终端里运行代码正常运行,提交PBS文件就不行了?为什么找不到matplotlib?它使用 usr/bin/ 中的 python,我认为这是我的默认值 python。我试过 运行ning pip,但它说 matplotlib 已更新。在尝试导入 matplotlib 之前,我还导入了其他包(如 numpy 和 datetime),并且没有错误。当我 运行 Julia 在集群的终端中调用 PyCall,然后 运行

julia> @pyimport matplotlib

加载完全正常。我做错了什么?

相关问题(与我的 .pbs 文件有关)可以在 此处找到:运行ning Julia on cluster 时缓存中缺少模块 FixedPointNumbers .

编辑:一件事是,当我 运行 Julia 通常在 ssh 进入集群时(即,只是在终端中,而不是通过提交 .pbs 文件),我得到了错误

Warning: No working GUI backend found for matplotlib

这会导致我在提交作业时遇到问题吗?

问题涉及我链接到 Julia 的 Python 包。这个版本的 Python 没有安装 matplotlib,要在这个版本的 python 上正确安装 matplotlib 的唯一方法是拥有管理员权限。我解决这个问题的方法是将 Julia 中的 Python 环境设置为 Julia 自己的 Conda 发行版:

julia> ENV["PYTHON"] = ""

然后我用 Conda 安装了 matplotlib。最后,我确保在 .pbs 文件中始终使用相同版本的 Julia;即,

module load julia/my_version

进行这些更改后,一切似乎都运行良好。