数据分析任务 - 自定义配置文件请求

Data profiling Task - custom Profile Request

是否有任何选项可以为 SSIS 数据分析任务创建自定义配置文件请求?

目前在 SSIS 数据分析任务下有 5 个标准配置文件请求:

  1. 列空比率配置文件请求
  2. 列统计配置文件请求
  3. 列长度分布配置文件请求
  4. 列值分布配置文件请求
  5. 候选人关键配置文件请求

我需要再添加一个(自定义一个)以获取所有数值的摘要。

在此先感谢您的帮助。

我想你想在这里做的是创建一个计算列,仅当 IsNumeric(SourceColumn) = 1 时才用你的源列填充。

然后在计算列上使用 Column Value Distribution Profile Request 创建配置文件任务,并将 ValueDistributionOption 设置为 AllValues

编辑:

为了进一步说明,计算列不一定是 SSIS 中的任务,尽管我在得出答案时就是这么想的。您可以更改要分析的 table,添加计算列,然后按照我上面解释的那样创建分析任务。

我还假设您想要分析单个列的值。如果您想对多列执行此操作,或者需要分析从详细记录聚合的汇总值,那么此答案可能不是最佳解决方案。

基于此Microsoft Documentation,SSIS 数据分析任务只有 5 个主要配置文件(在您的问题中列出)并且没有添加自定义配置文件的选项。

出于类似的原因,我将创建一个 Execute SQL Task 来实现它,您可以在 where 子句中使用您需要的聚合函数和 ISNUMERIC 函数:

SELECT MAX(CAST([Column] AS BIGINT)) -- Maximum value
       ,MIN(CAST([Column] AS BIGINT)) -- Minimum value
       ,COUNT(Column) -- Count values
       ,COUNT(DISTINCT [Column]) -- Count distinct values
       ,AVG(CAST([Column] AS BIGINT)) -- Average
       ,SUM(CAST([Column] AS BIGINT)) -- Sum
FROM TABLE
WHERE ISNUMERIC([Column]) = 1