使用 Azure 数据湖对 Polybase 进行基准测试
Benchmark test for polybase with azure data lake
有没有人使用 polybase 和 adl 执行基准测试,我想知道如果我有一个包含 400 万行的数据文件,polybase 是否有助于将这些行提取到数据仓库。任何人都可以post任何我可以了解这些东西的文章。
是的微软进行了一些试验,例如:
使用数据工厂在 15 分钟内将 1 TB 数据加载到 Azure SQL 数据仓库
https://docs.microsoft.com/en-us/azure/data-factory/data-factory-load-sql-data-warehouse
这是在使用数据工厂,但实际上是 Polybase 在引擎盖下进行繁重的工作。现在,它使用 Polybase 和 Blob 存储(不是数据湖),但你明白了。作为实验,你为什么不设置它,运行,然后将其转换为使用数据湖并报告回来?
有没有人使用 polybase 和 adl 执行基准测试,我想知道如果我有一个包含 400 万行的数据文件,polybase 是否有助于将这些行提取到数据仓库。任何人都可以post任何我可以了解这些东西的文章。
是的微软进行了一些试验,例如:
使用数据工厂在 15 分钟内将 1 TB 数据加载到 Azure SQL 数据仓库 https://docs.microsoft.com/en-us/azure/data-factory/data-factory-load-sql-data-warehouse
这是在使用数据工厂,但实际上是 Polybase 在引擎盖下进行繁重的工作。现在,它使用 Polybase 和 Blob 存储(不是数据湖),但你明白了。作为实验,你为什么不设置它,运行,然后将其转换为使用数据湖并报告回来?