使用数据工厂附加到 azure 数据湖中的文件

appending to a file in azure data lake using data factory

我 运行 在使用数据工厂将数据附加到 Azure 数据湖中的文件时遇到问题。 我正在尝试从 MS Graph API 获取数据,我能够获取数据并将其复制到 Single API 调用中,我使用“复制数据”功能将响应推送到数据湖,但是如果我想在得到响应的地方进行多次调用,然后将这些响应附加到一个文件中,我不知道该怎么做。我不认为“复制数据”activity 是正确的操作。

一个例子: API获取租户中的所有组:

https://graph.microsoft.com/v1.0/Groups/

API 获取与群组关联的所有成员:

https://graph.microsoft.com/v1.0/groups/"GroupID"/owners

“组 ID”来自顶部 API 调用。**

我能够构建循环并正确调用。 它只是在我不知所措的地方附加第二次通话的结果。我不认为为每个组创建一个新文件是正确的方法。

我认为您有几个问题需要解决。首先,标准 Blob 不支持追加操作。为此,您需要一个 AppendBlob。第二个问题是ADF不支持AppendBlob。

这里是 a question 我讨论复制 activity 和 AppendBlob 的地方。

这里 another answer(不是我的)有一个有趣的方法,它使用本机 REST API 来附加 blob。

另一种选择是让进程根据 运行 创建一个新文件。全部创建后,您可以使用 DataFlow 将它们折叠成一个文件。