SSIS - 执行分组依据并计算平面文件
SSIS - Perform group by and count on flat file
我对平面 .CSV 文件进行了一些转换和验证以导入数据。
我想添加一个列,其中包含员工在平面文件中出现的时间,例如:
输入数据流:
输出数据流:
我不知道如何转换我的数据流...有想法吗?
我会这样做:
- 如果您的数据尚未排序,请按 Employee_Id 排序。
- 使用多播将您的数据流分成两个流。
- 在其中一个流中,添加一个按 Employee_Id 分组的聚合转换,并为每个 Employee_Id 添加一个包含 COUNT(*) 的新计数列。此流中的时间将被忽略和丢弃。
- 合并 Employee_Id 将两个流重新合并在一起,仅保留聚合流中的计数列。
这应该为源数据中的每一行留下所需的一行输出,但每行的计数为 Employee_Id。
我对平面 .CSV 文件进行了一些转换和验证以导入数据。 我想添加一个列,其中包含员工在平面文件中出现的时间,例如:
输入数据流:
输出数据流:
我不知道如何转换我的数据流...有想法吗?
我会这样做:
- 如果您的数据尚未排序,请按 Employee_Id 排序。
- 使用多播将您的数据流分成两个流。
- 在其中一个流中,添加一个按 Employee_Id 分组的聚合转换,并为每个 Employee_Id 添加一个包含 COUNT(*) 的新计数列。此流中的时间将被忽略和丢弃。
- 合并 Employee_Id 将两个流重新合并在一起,仅保留聚合流中的计数列。
这应该为源数据中的每一行留下所需的一行输出,但每行的计数为 Employee_Id。