创建 RapidMiner 子流程以减少重复

Creating RapidMiner Subprocess to Reduce Repitition

rapidminer

我是 RapidMiner 的新手，但我正在使用它进行一些文本挖掘，并且有一个可能很简单的问题，我似乎无法在任何地方找到答案。

我正在从数据库中提取一些数据到 RapidMiner 中。从那里，我使用 attribute_value_filter 过滤数据以从原始数据中获取几个子集。

准备好所有子集后，我需要对每个子集执行完全相同的操作（提取一列数据、创建文档、标记化、词干提取、删除停用词等）。

有没有办法在 RapidMiner 中制作 "function"，这样我就不必为每个数据子集重复完全相同的操作集？我试过使用 subprocess 运算符，但我似乎无法为每个独立输入获得独立输出。也许我没有设置正确？我没有足够的声誉点数来显示我的流程的 post 个图像，但如果需要更多详细信息，请告诉我。

非常感谢任何反馈！

Execute Process 运算符是一个很好用的运算符。这允许创建以模块化方式使用的流程库。

我的博客中有一个示例 here。

创建 RapidMiner 子流程以减少重复

Creating RapidMiner Subprocess to Reduce Repitition

rapidminer