Knime:如何实现多行分割
Knime : How to achieve multi split by row
我想将一个数据集拆分成多个 1000 行的数据集,这怎么可能?
节点行拆分器只有两个输出。让我知道是否有任何方法可以使用 java 片段来满足此要求。
并未完全明确指定如何拆分 table,但有两种循环类型可能会满足您的需求:Chunk Loop (Start) or Group Loop (Start)。您的工作流程可能如下所示:
[(Chunk/Group) Loop Start] --> Your processing nodes of the selected rows --> [Loop End]
在Your processing nodes of the selected rows
部分你只会看到你需要的部分。
两个节点的区别如下:Chunk Loop Start节点根据行的位置将行收集到一个组中(同一组中的连续节点部分,直到消耗完请求的行数),而Group Loop Start 将具有相同属性的行收集到同一个集合中进行处理。 (根据您的处理要求,Loop End 节点可能不是最合适的,在这种情况下,请寻找其他 Loop End 节点。)
如果这些还不够,您可以尝试并行块循环节点,或者我记得在某些扩展中也有装袋、集成和交叉验证 (X-Validation) 节点。 (对于更复杂的工作流程,您还可以使用递归循环。)对于特征消除,您也可以寻求支持。
我想将一个数据集拆分成多个 1000 行的数据集,这怎么可能?
节点行拆分器只有两个输出。让我知道是否有任何方法可以使用 java 片段来满足此要求。
并未完全明确指定如何拆分 table,但有两种循环类型可能会满足您的需求:Chunk Loop (Start) or Group Loop (Start)。您的工作流程可能如下所示:
[(Chunk/Group) Loop Start] --> Your processing nodes of the selected rows --> [Loop End]
在Your processing nodes of the selected rows
部分你只会看到你需要的部分。
两个节点的区别如下:Chunk Loop Start节点根据行的位置将行收集到一个组中(同一组中的连续节点部分,直到消耗完请求的行数),而Group Loop Start 将具有相同属性的行收集到同一个集合中进行处理。 (根据您的处理要求,Loop End 节点可能不是最合适的,在这种情况下,请寻找其他 Loop End 节点。)
如果这些还不够,您可以尝试并行块循环节点,或者我记得在某些扩展中也有装袋、集成和交叉验证 (X-Validation) 节点。 (对于更复杂的工作流程,您还可以使用递归循环。)对于特征消除,您也可以寻求支持。