Informatica 中的间接加载

Indirect load in Informatica

informatica 中的间接加载在内部是如何工作的。它是整理所有数据然后处理数据还是一次只处理一个文件?如果我有跨越多个文件的重复项,我的映射中的重复项删除逻辑是否会删除重复项,或者我是否必须使用联合转换合并文件,然后在重复项删除逻辑中处理数据?

据我所知,Informatica 会像处理单个文件一样处理数据。所以是的,它应该删除文件中的重复项

只要您的管道在您实际过滤掉重复项之前有一个活动转换(即排序器),那么所有记录都将在移动到过滤器之前到达活动转换,并且问题将没有实际意义

Informatica 读取流就像读取单个文件一样。这就像你用通配符在文件名上做一个 cat ,例如。如果有两个文件 f1.txt 里面有 testlineAf2.txt 里面有 testlineB,而你 运行 一个 cat f*.txt 命令,你应该得到:

testlineA
testlineB

就像它来自一个文件一样。