如何在 Azure 数据工厂数据流模型中替换 Json 中的特定字符串
How to replace specific string from Json in Azure Data Factory Dataflow Model
您好,我是 Azure 数据工厂的新手。我的输入 JSON 是这样的:
{
"name": "Ranjana Sinha",
"schools": [{"schoolName": "ABC Institute",
"schoolAddress": "123, XYZ Road"},
{"schoolName": "AFG Primary",
"schoolAddress": "1002, XYZ Road"}]
}
在这里我想找到“XYZ”并将下面的“Road”替换为“Avenue”。我已经创建了管道,并且可以成功地将数据从源复制到接收器。有人可以指导我使用我应该用来修改过程中数据的功能吗?非常感谢任何文档或任何帮助。
数据工厂管道不直接处理数据,而是执行其他活动来执行操作。您已经使用副本 activity 完成了此操作,但您发现它相当有限。
对于内联数据操作,您需要在具有该功能的管道内使用 activity。在这种情况下,您应该调查 Data Flow which executes as a Spark job at runtime. As such it has rich expression capabilities。我没有您的特定用例的方便示例,但以下模式应该适合您:
- 阅读 JSON 作为来源(可能是带有架构的数据集)。
- 使用派生列执行字符串替换。
- 将结果输出到 Sink。
您好,我是 Azure 数据工厂的新手。我的输入 JSON 是这样的:
{
"name": "Ranjana Sinha",
"schools": [{"schoolName": "ABC Institute",
"schoolAddress": "123, XYZ Road"},
{"schoolName": "AFG Primary",
"schoolAddress": "1002, XYZ Road"}]
}
在这里我想找到“XYZ”并将下面的“Road”替换为“Avenue”。我已经创建了管道,并且可以成功地将数据从源复制到接收器。有人可以指导我使用我应该用来修改过程中数据的功能吗?非常感谢任何文档或任何帮助。
数据工厂管道不直接处理数据,而是执行其他活动来执行操作。您已经使用副本 activity 完成了此操作,但您发现它相当有限。
对于内联数据操作,您需要在具有该功能的管道内使用 activity。在这种情况下,您应该调查 Data Flow which executes as a Spark job at runtime. As such it has rich expression capabilities。我没有您的特定用例的方便示例,但以下模式应该适合您:
- 阅读 JSON 作为来源(可能是带有架构的数据集)。
- 使用派生列执行字符串替换。
- 将结果输出到 Sink。