如何 运行 PySpark 与第 3 方 Jars 例如模糊模糊?

How to run PySpark with 3rd party Jars e.g. fuzzywuzzy?

尝试了 --jars 选项和 --driver-class-jars 等。它仍然给我 'no module fuzzywuzzy' 发现错误。

尝试pyspark --packages me.xdrop:fuzzywuzzy:1.1.8

另请参阅 以了解其他一些选项,具体取决于您想要的 workflow/environment。