Pentaho,多个输入的多个输出
Pentaho, multiple outputs for multiple inputs
我一直在尝试弄清楚如何设置 Pentaho 为作业的每个输入写入不同的文件。
我的转换很快就能从 FTP 中获取 .txt 文件,文件数量不等,我的转换现在的方式,无论它从文件夹中获得多少文件(FTP or local) 它正在生成一个大的 XLS 输出,输出端的信息都是正确的,它都匹配我想要精确提取的数据,但是为了组织这些文件,我需要 pentaho 来创建一个单一的文件,来自单个输入。
如果文件(//PentahoIn0001.txt,//PentahoIn0002.txt,//PentahoIn0003.txt)被处理我想要(//PentahoOut0001.xls,//PentahoOut0002.xls, //PentahoOut0003.xls) 被创建,现在的方式是只创建一个包含所有三个输入的数据的文件。
到目前为止,我已经尝试了几种方法都没有结果,甚至来自这里和外部的帖子都包含其他几个辅助转换和工作来完成它,但它根本没有。
将输出文件名保存在行中,并确保行在文件名调用 Transformation Executor
上排序,并使用应保存数据的新转换。确保在文件名字段上启用 Row grouping
,并将文件名作为 Parameter
传递给新转换。
在子转换中以 Get rows from result
开始并使用传递的文件名参数将结果保存到文件中。
我一直在尝试弄清楚如何设置 Pentaho 为作业的每个输入写入不同的文件。
我的转换很快就能从 FTP 中获取 .txt 文件,文件数量不等,我的转换现在的方式,无论它从文件夹中获得多少文件(FTP or local) 它正在生成一个大的 XLS 输出,输出端的信息都是正确的,它都匹配我想要精确提取的数据,但是为了组织这些文件,我需要 pentaho 来创建一个单一的文件,来自单个输入。
如果文件(//PentahoIn0001.txt,//PentahoIn0002.txt,//PentahoIn0003.txt)被处理我想要(//PentahoOut0001.xls,//PentahoOut0002.xls, //PentahoOut0003.xls) 被创建,现在的方式是只创建一个包含所有三个输入的数据的文件。
到目前为止,我已经尝试了几种方法都没有结果,甚至来自这里和外部的帖子都包含其他几个辅助转换和工作来完成它,但它根本没有。
将输出文件名保存在行中,并确保行在文件名调用 Transformation Executor
上排序,并使用应保存数据的新转换。确保在文件名字段上启用 Row grouping
,并将文件名作为 Parameter
传递给新转换。
在子转换中以 Get rows from result
开始并使用传递的文件名参数将结果保存到文件中。