将整个 rapidminer 存储库导出到多个文件中
Export entire rapidminer repository into multiple files
我收到了一些 rapidminer 的 ExampleSets 格式的实验数据。数据显示为具有多个 'data entries' 的单个存储库(不确定术语是否正确)。将其导出为更方便的格式以保持文件夹结构和命名的最简单方法是什么?
- 我知道如何通过创建流程导出单个文件,该流程包括检索存储库、写入 CSV、写入文件。对我来说不是很有效,因为我有很多 repositories/files.
- Loop Repository 应该适合,但是我不知道如何为 Write file.[=25 自动设置文件名=]
- 我能想到的另一种选择是自己实现转换器。来源是 available,但如果有一个简单的流程解决方案,这可能有点矫枉过正。
要开始,请执行以下操作。
在 Loop Repository
运算符中,将输入直接连接到输出。将参数 entry type
设置为 IOObject
和 select 包含所需数据的存储库文件夹。
输出将是示例集和其他对象的集合。
从这里,您可以设置 filter
参数来限制条目。
在运算符内部,由运算符参数定义的宏被设置为存储库中条目的名称和路径,您可以将它们与其他运算符一起使用以执行您想要的操作。
我收到了一些 rapidminer 的 ExampleSets 格式的实验数据。数据显示为具有多个 'data entries' 的单个存储库(不确定术语是否正确)。将其导出为更方便的格式以保持文件夹结构和命名的最简单方法是什么?
- 我知道如何通过创建流程导出单个文件,该流程包括检索存储库、写入 CSV、写入文件。对我来说不是很有效,因为我有很多 repositories/files.
- Loop Repository 应该适合,但是我不知道如何为 Write file.[=25 自动设置文件名=]
- 我能想到的另一种选择是自己实现转换器。来源是 available,但如果有一个简单的流程解决方案,这可能有点矫枉过正。
要开始,请执行以下操作。
在 Loop Repository
运算符中,将输入直接连接到输出。将参数 entry type
设置为 IOObject
和 select 包含所需数据的存储库文件夹。
输出将是示例集和其他对象的集合。
从这里,您可以设置 filter
参数来限制条目。
在运算符内部,由运算符参数定义的宏被设置为存储库中条目的名称和路径,您可以将它们与其他运算符一起使用以执行您想要的操作。