按需在 Azure Blob 存储和 Azure 数据库之间移动数据

Moving data between Azure Blob storeage and Azure database on demand

我有一个项目需要按需处理从 Azure blob 到 Azure 数据库的数据。我们正朝着使用 Azure 数据工厂的方向前进,但我对它的阅读越多,我就越不相信这是要走的路。我有两个顾虑:

  1. 看起来一切都需要在 ADF 中安排,我见过的执行按需流程的唯一方法是使用 isPaused 属性.

  2. 并发 - 多个用户可能会同时 运行 进程。我以前用 SSIS 包对此进行过编码,但从未使用过 ADF。这可能吗?

这似乎是该过程的错误工具,但也许我错了。

Azure 数据工厂 (ADF) 是一个非常好的工具,但您需要以不同的方式思考问题。在某些方面它类似于 SSIS,但在许多方面又不是。特别是作为 ELT 和编排工具而不是 ETL 工具(如 SSIS),转换是在其他地方完成的,通常是在您正在 运行 的计算上而不是在 ADF 管道中。

调度是围绕 slices 建模的,这是理解 ADF 的一个重要主题。在您的示例中,您可以拥有以年份命名的目录,其中包含月份的子目录、日期的子目录等,一直到您需要的任何级别。将您的频率设置为匹配,例如月、日、小时等,然后 ADF 将为每个时间片创建片并相应地 运行。关于并发性,多个用户可以将他们的文件放在 blob 存储中,ADF 将处理每个文件,比如每 15 分钟一次。这只是解决同一问题的另一种方式,有意义吗?

您始终可以选择在云中 运行ning SSIS,显然您需要一个 VM (IaaS) 来 运行 它。有 SSIS Azure Feature Pack,它有 Azure Blob 源和目标,所以很容易做你需要的。