从 SQL 服务器 Polybase 访问 Azure Data Lake Analytics 表

Access Azure Data Lake Analytics Tables from SQL Server Polybase

我需要将通过 Azure Data Lake Analytics (ADLA) 处理的多 TB 数据集导出到 SQL 服务器数据库。

根据我目前的研究,我知道我可以使用内置输出器将 (ADLA) 输出的结果写入数据湖存储或 WASB,然后从 SQL 读取输出数据服务器使用 Polybase。

然而,将 ADLA 处理的结果创建为 ADLA table 对我们来说似乎很有吸引力。它是一个干净的解决方案(无需管理文件)、多个读取器、内置分区、分发密钥以及允许其他进程访问 table 的潜力。

如果我们使用 ADLA tables,我可以通过 SQL Polybase 访问 ADLA tables 吗?如果没有,是否有任何方法可以直接从 Polybase 访问 ADLA tables 下的文件?

我知道我可能可以使用 ADF 执行此操作,但此时我想尽可能避免使用 ADF - 以最大限度地降低成本并保持流程简单。

遗憾的是,Polybase 对 ADLA 表的支持仍在规划中,尚未可用。请通过 SQL Data Warehouse User voice page.

提交功能请求

建议work-around在ADLA中将信息生成为Csv,然后在SQLDW中创建分区分布式table并使用Polybase读取数据填充SQL DW 托管 table.