pyspark matplotlib 与 Zeppelin 的集成

pyspark matplotlib integration with Zeppelin

我正在尝试在 Zeppelin 笔记本中使用 pyspark 绘制直方图。这是我到目前为止尝试过的方法,

%pyspark

import matplotlib.pyplot as plt
import pandas
...
x=dateDF.toPandas()["year(CAST(_c0 AS DATE))"].values.tolist()
y=dateDF.toPandas()["count(year(CAST(_c0 AS DATE)))"].values.tolist()
plt.plot(x,y)
plt.show()

此代码 运行 没有错误,但未给出预期的情节。所以我用谷歌搜索并找到了这个 documantation

据此,我尝试如下启用angular标志,

x=dateDF.toPandas()["year(CAST(_c0 AS DATE))"].values.tolist()
y=dateDF.toPandas()["count(year(CAST(_c0 AS DATE)))"].values.tolist()
plt.close()
z.configure_mpl(angular=True,close=False)
plt.plot(x,y)
plt.show()

但现在我收到一个名为 No module named 'mpl_config' 的错误,我不知道如何在没有它的情况下启用 angular。如果您能建议如何解决这个问题,我们将不胜感激

经过一段时间的努力,我注意到这是 Zepplien 笔记本上的一个主要 Bug 由@Ruslan Dautkhanov 在 2020 年 11 月标记的。据他说,

mpl_config is part of core Zeppelin. The old Python Interpreter was copying it manually here https://github.com/apache/zeppelin/blob/0d746fa2e2787a661db70d74035120ae3516ace3/python/src/main/java/org/apache/zeppelin/python/PythonInterpreter.java#L179

但是新的 IPythonInterpeter 不会这样做。

希望以后能解决这个问题,留着以后参考