如何在 Azure 数据工厂数据流模型中替换 Json 中的特定字符串

How to replace specific string from Json in Azure Data Factory Dataflow Model

您好,我是 Azure 数据工厂的新手。我的输入 JSON 是这样的:

{
    "name": "Ranjana Sinha",
    "schools": [{"schoolName": "ABC Institute",
                 "schoolAddress": "123, XYZ Road"},
                {"schoolName": "AFG Primary",
                 "schoolAddress": "1002, XYZ Road"}]

}

在这里我想找到“XYZ”并将下面的“Road”替换为“Avenue”。我已经创建了管道,并且可以成功地将数据从源复制到接收器。有人可以指导我使用我应该用来修改过程中数据的功能吗?非常感谢任何文档或任何帮助。

数据工厂管道不直接处理数据,而是执行其他活动来执行操作。您已经使用副本 activity 完成了此操作,但您发现它相当有限。

对于内联数据操作,您需要在具有该功能的管道内使用 activity。在这种情况下,您应该调查 Data Flow which executes as a Spark job at runtime. As such it has rich expression capabilities。我没有您的特定用例的方便示例,但以下模式应该适合您:

  1. 阅读 JSON 作为来源(可能是带有架构的数据集)。
  2. 使用派生列执行字符串替换。
  3. 将结果输出到 Sink。