Ganglia 中 python gmond_python_modules 的导入错误

Import error with python gmond_python_modules in Ganglia

我使用 gmond_python_modules,试图监控一个集群,该集群有多个主机,每个主机有 8 个 GPU。

在完成最后的步骤后,我尝试在我的网络节点上重启 gmond 服务,只得到:

Starting GANGLIA gmond: Could not find platform independent libraries <prefix>
Could not find platform dependent libraries <exec_prefix>
Consider setting $PYTHONHOME to <prefix>[:<exec_prefix>]
ImportError: No module named site
                                                           [FAILED]

我搜索了一下,最初以为是因为我编译的 ganglia 没有 --with-python 选项。但事实并非如此。我用那个选项重新编译(检查了配置输出,它说它找到了 python)并且一切正常,直到我添加了 GPU 监控 python 模块。再次出现同样的错误。

而且我也试过手动赋值PYTHONHOMEPYTHONPATH,没有区别。我安装了蟒蛇。是否是导致Ganglia找不到正确加载路径的可能原因?

欢迎任何想法。并将在需要时提供更多详细信息。

分发和版本详细信息:
系统:centos 6.8
Python:web节点2.7,计算节点2.6
神经节:3.7.2
gmond_python_modules:克隆表格 Github 今天

参见this post。这里的原因是计算节点没有安装python-devel,导致'python.h'丢失。所以 ganglia 配置脚本无法检测到 python 支持。