使用 PySpark 将模型导出为 PMML
Export models as PMML using PySpark
是否可以使用 PySpark 将模型导出为 PMML?我知道这可以使用 Spark。但我没有在 PySpark 文档中找到任何参考。那么这是否意味着如果我想这样做,我需要使用一些第三方 python PMML 库编写自定义代码?
可以使用 JPMML-SparkML library. Furthermore, this library is made available for end users in the form of a "Spark Package" by the JPMML-SparkML-Package 项目将 Apache Spark 管道导出到 PMML。
示例 PySpark 代码:
from jpmml_sparkml import toPMMLBytes
pmmlBytes = toPMMLBytes(sc, df, pipelineModel)
print(pmmlBytes)
是否可以使用 PySpark 将模型导出为 PMML?我知道这可以使用 Spark。但我没有在 PySpark 文档中找到任何参考。那么这是否意味着如果我想这样做,我需要使用一些第三方 python PMML 库编写自定义代码?
可以使用 JPMML-SparkML library. Furthermore, this library is made available for end users in the form of a "Spark Package" by the JPMML-SparkML-Package 项目将 Apache Spark 管道导出到 PMML。
示例 PySpark 代码:
from jpmml_sparkml import toPMMLBytes
pmmlBytes = toPMMLBytes(sc, df, pipelineModel)
print(pmmlBytes)