我可以导出 RapidMiner 模型以与 python 集成吗?

Can I export RapidMiner model to integrate with python?

在尝试了很多算法并在我的数据集上对其进行评估后,我使用 RapidMiner 训练了一个分类器模型。 我还将模型从 RapidMiner 导出为 XML 和 pkl 文件,但我无法在我的 python 程序 (scikit-learn) 中读取它。 有什么方法可以在 python 程序中导入 RapidMiner classifier/model 并使用它来预测或分类我的最终应用程序中的新数据?

实际上,我会说不——如果你想要的话,从一开始就在 sklearn 中训练你的模型。

您的 RapidMiner 模型是某种对象。您导出的两种格式只是存储方法。 Sklearn 模型是一种不同的对象。您不能直接保存一个并将其加载到另一个。一个类似的例子是问你是否可以把飞机引擎装进火车。

要执行您要求的操作,您需要获取分类器保存的基础数据,找到格式,然后想办法以与 sklearn 分类器相同的格式获取它。这取决于您拥有的分类器类型。例如,如果您使用贝叶斯模型,您可以以某种方式捕获先验概率然后使用它们,但这并非微不足道。

您可以使用 pmml extenstion for RapidMiner 来导出您的模型。

对于 python,例如有 augustus 库可以处理 pmml 文件。