zeppelin 无法导入 pandas、numpy、scipy

zeppelin unable to import pandas, numpy, scipy

用 zeppelin 编写的代码,当我在那里启动 pyspark 但在 zeppelin 中使用相同的代码时,它在 shell 中工作和导入正常。

 %pyspark
import pandas

Traceback (most recent call last):
  File "/tmp/zeppelin_pyspark-4245945050627073162.py", line 239, in <module>
    eval(compiledCode)
  File "<string>", line 1, in <module>
ImportError: No module named pandas

这是因为机器上没有安装pandas。

如果没有安装pip,先安装pip。

sudo curl --silent --show-error https://bootstrap.pypa.io/get-pip.py | python

然后安装pandas

sudo pip install pandas

或者像这样使用[docker]。

docker run -d -p 8080:8080 -t knockdata/zeppelin-highcharts

zeppelin-highcharts image include pandas and Highcharts functionality.