如何提高 Informatica PowerCenter 10 for FileReader 的吞吐量

How to increase throughput in Informatica PowerCenter 10 for FileReader

ter][1]1我有一个工作流程,其中 XML 数据使用 XML 解析器转换从文件中读取。它有 12 个目标表来加载它们。目前它工作成功,但问题是从文件中读取数据时的吞吐量(Rows/Sec)。对于 10 个或更少的文件,它提供 10 rows/sec 的吞吐量。但是如果我提供超过 10 行,那么最初在工作流开始时吞吐量是 4 到 5 rows/sec 然后突然下降到 1 row/sec。对于所有文件,它仍然是 1 row/sec。有时我有 300 或 400 个文件,仅阅读这 300 400 行就需要花费太多时间,整个 1 row/sec.

我试图通过增加 DTM 缓冲区和默认块大小值来改进。 我也试过 "Dynamic Partitioning Option" 到 "Based on number of Partitions"。

但是没有成功。

正如会话日志统计中提到的那样,2 个加入者是瓶颈,因为他们的忙碌百分比几乎是 100%。因此,我在这些连接器之前添加了排序器,然后降低精度值以避免排序器行大小限制为 8MB。现在吞吐量也增加了,等于文件数/秒而不是一个 row/sec.