如何将 sparkR 模型导出为 PMML?

How to export a sparkR model as PMML?

我正在尝试将 sparkR 模型导出为 PMML。

第一种方法是使用 pmml 库:

library(pmml)
sparkR.session()
data(iris)
df <- createDataFrame(iris)
model <- spark.kmeans(df, Sepal_Length ~ Sepal_Width, k = 4, initMode = "random")
model_pmml <- pmml(model)

错误:

Error in UseMethod("pmml"): no applicable method for 'pmml' applied to an object of class "KMeansModel"
Traceback:

1. pmml(model)

我还调查了是否可以从 SparkR 使用 scala 模型上可用的 toPMML 方法。我发现 question 表明它可能适用于 Sparklyr,但不适用于 SparkR。

有什么想法吗?

我得出的结论是不支持导出 spark R 模型。我为此添加了一个功能请求:https://issues.apache.org/jira/browse/SPARK-21430。如果您也在寻找此功能,请在 jira 票上投票。