如何通过 Azure Data Lake Store gen1 中的新文件触发 Azure Data Factory v2 或 Azure Databricks Notebook 中的管道

How to trigger a pipeline in Azure Data Factory v2 or a Azure Databricks Notebook by a new file in Azure Data Lake Store gen1

我正在使用 Azure Data Lake Store gen1 来存储 JSON 文件。基于这些文件,我在 Azure Databricks 中有笔记本来处理它们。现在我想在 Azure Data Lake Store gen1 中创建新文件时触发这样的 Azure Databricks Notebook。我找不到任何可以做到这一点的触发器。你有什么办法吗?

目前,尚未 implemented/Supported Microsoft。但它在他们的路线图上(我相信)。

您可以通过两种方式做到这一点,

  1. Azure 函数(通过事件网格)

  2. 逻辑应用


选项#1

目前,Microsoft 正在构建 #1。

您可以跟踪问题 here

按照这个

This feature is not a high priority for us right now, but I will note that the announcement for Azure Event Grid listed Data Lake as one of the integrations they are building. Once you can subscribe to Data Lake updates through Event Grid, running an Azure Function would be trivial (see here for some info).

您可以vote your voice支持DataLake中的事件网格(提供者)。


选项#2

这个也还没有实现,不过你可以Upvote your voice这里支持这个功能