Python Pig 中的 UDF

Python UDF in Pig

每当我尝试在 pig udf 中导入 python 的外部包时,它会显示以下错误

Python Error. Traceback (most recent call last): File "pythonudf.py", line 5, in from bs4 import BeautifulSoup ImportError: No module named bs4

我试过包含库路径

import sys
sys.path.append('/usr/local/lib/python3.5/dist-packages')

并设置

export JYTHONPATH=$JYTHONPATH:/usr/local/lib/python3.5/dist-packages

但它仍然显示相同的错误。 我还可以做些什么? 该脚本不在本地或 mapreduce 模式下 运行。

PS: 其他不导入外部包的功能运行完美。

编辑: python代码中的包已安装。

使用 python udf 导入包执行 pig 时使用 -embedded 选项。Reference

pig -embedded jython pythonudf.py