SSIS - 执行分组依据并计算平面文件

SSIS - Perform group by and count on flat file

我对平面 .CSV 文件进行了一些转换和验证以导入数据。 我想添加一个列,其中包含员工在平面文件中出现的时间,例如:

输入数据流:

输出数据流:

我不知道如何转换我的数据流...有想法吗?

我会这样做:

  1. 如果您的数据尚未排序,请按 Employee_Id 排序。
  2. 使用多播将您的数据流分成两个流。
  3. 在其中一个流中,添加一个按 Employee_Id 分组的聚合转换,并为每个 Employee_Id 添加一个包含 COUNT(*) 的新计数列。此流中的时间将被忽略和丢弃。
  4. 合并 Employee_Id 将两个流重新合并在一起,仅保留聚合流中的计数列。

这应该为源数据中的每一行留下所需的一行输出,但每行的计数为 Employee_Id。