为什么我不使用 Databricks 作为我的数据集市?
Why would I not used Databricks as my data mart?
我正在努力了解 Databricks。
我找到了逐步从 S3 或 Azure Datalake 导入数据,然后输出到 Azure Synapse Analytics 或其他数据仓库解决方案的文档。
快速播放后,我认识到您可以简单地在 Databricks 中保存 table,使用 SQL 访问它,甚至将它作为源拉入 PowerBI。
所以我的问题是:对于一个小型数据集市(10 个 dims,5 个事实),当我可以简单地离开时,为什么我会选择支付额外的数据库解决方案,如 Azure SQL、Synapse、RDS 或其他Databricks 中 table 中的数据,然后从那里直接从我的报告工具访问它?
提前致谢。
安迪
是的,这很有可能。只是想让你知道 SQL Azure 和 Synapse 可能是 Microsoft 的产品,但它们的用途不同,Synapse 支持 MPP,因此它支持更多的大数据实现。此外,不仅有多少维度和事实 table,有多少数据,它有什么样的聚合等都变得决定性。
我正在努力了解 Databricks。
我找到了逐步从 S3 或 Azure Datalake 导入数据,然后输出到 Azure Synapse Analytics 或其他数据仓库解决方案的文档。
快速播放后,我认识到您可以简单地在 Databricks 中保存 table,使用 SQL 访问它,甚至将它作为源拉入 PowerBI。
所以我的问题是:对于一个小型数据集市(10 个 dims,5 个事实),当我可以简单地离开时,为什么我会选择支付额外的数据库解决方案,如 Azure SQL、Synapse、RDS 或其他Databricks 中 table 中的数据,然后从那里直接从我的报告工具访问它?
提前致谢。
安迪
是的,这很有可能。只是想让你知道 SQL Azure 和 Synapse 可能是 Microsoft 的产品,但它们的用途不同,Synapse 支持 MPP,因此它支持更多的大数据实现。此外,不仅有多少维度和事实 table,有多少数据,它有什么样的聚合等都变得决定性。