了解 ADF 数据集

Understanding ADF Data Sets

我了解到在 Azure 数据工厂中,数据集是一些源数据的视图。您能否通过连接两个源表的查询创建单个数据集?或者您是否必须创建两个数据集,一个使用连接转换的数据流,以创建第三个数据集,作为该转换的接收器,这就是期望的结果?

似乎源表不是 ADF 中的东西,只是数据集(只是表)?我发现这非常令人困惑,也许我不了解更高的背景。

DataSet 不是数据视图,它是指向某个位置的指针,并且可以选择描述在该位置找到的架构。在你的例子中,一个指向 table 的指针,所以是的,你需要为每个 SOURCE table 和一个 Schema 提供一个数据集。您可以在一个数据流中将它们连接在一起,然后您将需要另一个 DataSet 用于 SINK。根据接收器类型,您可能需要也可能不需要创建架构。

我假设 tables 有一些 SQL 变体 - 如果是这样,并且如果两个 tables 在同一个数据库中,那么我建议做在 SQL 中加入,因为它会更快、更有效。如果接收器也在同一个数据库中,那么您将从存储过程而不是数据流中获得最大的收益。