from pyspark.sql.snappy import SnappyContext - ImportError: No module named snappy

from pyspark.sql.snappy import SnappyContext - ImportError: No module named snappy

即使在我尝试导入时重新安装 pyspark 和 snappydata 之后 pyspark.sql.snappy 从以下代码导入 SnappyContext:

from pyspark.sql.snappy import SnappyContext
from pyspark.storagelevel import StorageLevel
SparkContext._ensure_initialized()

spark = SparkSession.builder.appName("test")  \
                        .master("local[*]") \
                        .config("spark.snappydata.connection", "localhost:1527") \
                        .getOrCreate() 

snappy = SnappySession(spark)
snappy.sql("SELECT col1, min(col2) from TABLE1")

我收到错误:

Traceback (most recent call last):
  File "testpy.py", line 4, in <module>
    from pyspark.sql.snappy import SnappyContext
ImportError: No module named snappy

请帮忙!

这是上一版本中的已知问题。这已在最新的 master 中修复。 $SNAPPY_HOME/bin/pyspark 指的是 $SNAPPY_HOME/pyspark 文件夹中的 python 脚本。不幸的是,一些构建更改停止复制文件夹中的 SnappyData python 脚本。您可以构建当前的 master 以使用 pyspark。