Azure 数据仓库和 Microsoft 并行数据仓库 (PDW) 之间的区别

Differences between Azure Data Warehouse and Microsoft Parallel Datawarehouse (PDW)

我想知道 Azure 数据仓库和 Microsoft 并行数据仓库 (PDW) 之间的主要区别。

我在这里阅读了一篇关于 Azure Data Warehouse 的文章。 此外,还有一篇关于 Microsoft PDW 的文章。

从特性和功能来看,它们看起来很相似。但是,我想知道它们之间的主要区别以及在什么情况下,一个比另一个更好。

高级别,

并行数据仓库 (PDW) 是本地版本,您必须在其中维护虚拟机并 IAAS(Infrastructure as a Service) 托管。您必须注意修补服务器。

Azure SQL 数据仓库是 PAAS(Platform as a Service),您不需要维护虚拟机和应用补丁。

Azure SQL 数据仓库在功能方面不同于并行数据仓库。同样,PDW 也遗漏了一些特性。

Missing features of Azure SQL Datawarehouse

虽然有很多相似之处,但这里是两者之间的一些主要区别(除了一个是云,另一个是内部部署)。

  • APS 数据加载有一个名为 dwloader.exe 的工具用于高速加载
  • SQL DW 加载建议是通过 polybase(来自 Blob Storage 或 Azure Data Lake 的外部表)
  • APS 扩展是通过增加容量完成的。
  • SQL DW 缩放是动态完成的,还提供暂停以降低成本

还有一些额外的内部差异,例如复制表的实现方式和 SQL DW 中的固定分布数。

至于什么时候一个比另一个好,我想说主要原因是云或本地。云是一个托管实例,具有定期更新的新功能和补丁。动态缩放和 Pause/Resume 也是非常好的降低成本的功能。