按需在 Azure Blob 存储和 Azure 数据库之间移动数据
Moving data between Azure Blob storeage and Azure database on demand
我有一个项目需要按需处理从 Azure blob 到 Azure 数据库的数据。我们正朝着使用 Azure 数据工厂的方向前进,但我对它的阅读越多,我就越不相信这是要走的路。我有两个顾虑:
看起来一切都需要在 ADF 中安排,我见过的执行按需流程的唯一方法是使用 isPaused 属性.
并发 - 多个用户可能会同时 运行 进程。我以前用 SSIS 包对此进行过编码,但从未使用过 ADF。这可能吗?
这似乎是该过程的错误工具,但也许我错了。
Azure 数据工厂 (ADF) 是一个非常好的工具,但您需要以不同的方式思考问题。在某些方面它类似于 SSIS,但在许多方面又不是。特别是作为 ELT 和编排工具而不是 ETL 工具(如 SSIS),转换是在其他地方完成的,通常是在您正在 运行 的计算上而不是在 ADF 管道中。
调度是围绕 slices 建模的,这是理解 ADF 的一个重要主题。在您的示例中,您可以拥有以年份命名的目录,其中包含月份的子目录、日期的子目录等,一直到您需要的任何级别。将您的频率设置为匹配,例如月、日、小时等,然后 ADF 将为每个时间片创建片并相应地 运行。关于并发性,多个用户可以将他们的文件放在 blob 存储中,ADF 将处理每个文件,比如每 15 分钟一次。这只是解决同一问题的另一种方式,有意义吗?
您始终可以选择在云中 运行ning SSIS,显然您需要一个 VM (IaaS) 来 运行 它。有 SSIS Azure Feature Pack,它有 Azure Blob 源和目标,所以很容易做你需要的。
我有一个项目需要按需处理从 Azure blob 到 Azure 数据库的数据。我们正朝着使用 Azure 数据工厂的方向前进,但我对它的阅读越多,我就越不相信这是要走的路。我有两个顾虑:
看起来一切都需要在 ADF 中安排,我见过的执行按需流程的唯一方法是使用 isPaused 属性.
并发 - 多个用户可能会同时 运行 进程。我以前用 SSIS 包对此进行过编码,但从未使用过 ADF。这可能吗?
这似乎是该过程的错误工具,但也许我错了。
Azure 数据工厂 (ADF) 是一个非常好的工具,但您需要以不同的方式思考问题。在某些方面它类似于 SSIS,但在许多方面又不是。特别是作为 ELT 和编排工具而不是 ETL 工具(如 SSIS),转换是在其他地方完成的,通常是在您正在 运行 的计算上而不是在 ADF 管道中。
调度是围绕 slices 建模的,这是理解 ADF 的一个重要主题。在您的示例中,您可以拥有以年份命名的目录,其中包含月份的子目录、日期的子目录等,一直到您需要的任何级别。将您的频率设置为匹配,例如月、日、小时等,然后 ADF 将为每个时间片创建片并相应地 运行。关于并发性,多个用户可以将他们的文件放在 blob 存储中,ADF 将处理每个文件,比如每 15 分钟一次。这只是解决同一问题的另一种方式,有意义吗?
您始终可以选择在云中 运行ning SSIS,显然您需要一个 VM (IaaS) 来 运行 它。有 SSIS Azure Feature Pack,它有 Azure Blob 源和目标,所以很容易做你需要的。