Azure 数据工厂搜索和替换 CSV 文件中的令牌
Azure Data Factory Search and Replace tokens in CSV file
我正在使用 Azure 数据工厂处理一个超过 40 列的 csv 文件。在这些字段中,可以但并非总是有我要替换的 10 多个标记之一。
搜索整个文件并将这些标记替换为其他值的最佳方法是什么?每个令牌都有不同的值,我想将其替换为。
我知道我可以在数据流中的派生列模式修饰符上使用替换函数来逐列搜索和替换字符串(见下文)。当我需要搜索 10 个以上的标记并替换为 10 个以上的值时,这将只允许我一次搜索一个标记。
我也不想在派生列架构修饰符中创建超过 40 个条目,我想有更好的方法来实现我正在寻找的东西吗?
如果有任何建议,我将不胜感激。
部分字段数据示例
例如“1 Summer Road[<000013>]”,“[<000013>]”,“沃金顿[<000013>][<000010>]曼彻斯特”,“”,“”,“”,” 1 Summer Road[<000013>][<000010>][<000013>][<000010>]沃金顿[<000013>][<000010>]曼彻斯特","我们的客户[<000039>]时间表",
您可以在派生列转换用例表达式中添加列模式以同时查找和替换多个值。
示例:
- 来源
- 派生列
表达式:
case($$=='A001', 'A01',
$$=='B001', 'B01',
$$=='C001', 'C01',
$$=='D001', 'D01', $$)
派生列输出:
我正在使用 Azure 数据工厂处理一个超过 40 列的 csv 文件。在这些字段中,可以但并非总是有我要替换的 10 多个标记之一。
搜索整个文件并将这些标记替换为其他值的最佳方法是什么?每个令牌都有不同的值,我想将其替换为。
我知道我可以在数据流中的派生列模式修饰符上使用替换函数来逐列搜索和替换字符串(见下文)。当我需要搜索 10 个以上的标记并替换为 10 个以上的值时,这将只允许我一次搜索一个标记。
我也不想在派生列架构修饰符中创建超过 40 个条目,我想有更好的方法来实现我正在寻找的东西吗?
如果有任何建议,我将不胜感激。
部分字段数据示例
例如“1 Summer Road[<000013>]”,“[<000013>]”,“沃金顿[<000013>][<000010>]曼彻斯特”,“”,“”,“”,” 1 Summer Road[<000013>][<000010>][<000013>][<000010>]沃金顿[<000013>][<000010>]曼彻斯特","我们的客户[<000039>]时间表",
您可以在派生列转换用例表达式中添加列模式以同时查找和替换多个值。
示例:
- 来源
- 派生列
表达式:
case($$=='A001', 'A01',
$$=='B001', 'B01',
$$=='C001', 'C01',
$$=='D001', 'D01', $$)
派生列输出: