创建 RapidMiner 子流程以减少重复

Creating RapidMiner Subprocess to Reduce Repitition

我是 RapidMiner 的新手,但我正在使用它进行一些文本挖掘,并且有一个可能很简单的问题,我似乎无法在任何地方找到答案。

我正在从数据库中提取一些数据到 RapidMiner 中。从那里,我使用 attribute_value_filter 过滤数据以从原始数据中获取几个子集。

准备好所有子集后,我需要对每个子集执行完全相同的操作(提取一列数据、创建文档、标记化、词干提取、删除停用词等)。

有没有办法在 RapidMiner 中制作 "function",这样我就不必为每个数据子集重复完全相同的操作集?我试过使用 subprocess 运算符,但我似乎无法为每个独立输入获得独立输出。也许我没有设置正确?我没有足够的声誉点数来显示我的流程的 post 个图像,但如果需要更多详细信息,请告诉我。

非常感谢任何反馈!

Execute Process 运算符是一个很好用的运算符。这允许创建以模块化方式使用的流程库。

我的博客中有一个示例 here