使用 PowerBI 可视化 SQL 数据仓库中的大量数据
Using PowerBI to visualize large amounts of data on a SQL Data Warehouse
我有一个 SQL DW,大约 30 GB。我想使用 PowerBI 来可视化这些数据,但我注意到 PowerBI 桌面 only supports file size up to 250MB。连接到 PowerBI 以可视化此数据的最佳方式是什么?
根据您的用例,您有几个选择:
- 源数据直接查询
- 基于视图的源数据聚合
直接查询
对于较小的数据集(考虑数千行),您可以简单地 connect PowerBI 直接到 Azure SQL 数据仓库并使用 table 视图将数据提取为必要的。
基于视图的聚合
对于更大的数据集(想想数百万、数十亿,甚至数万亿行),运行 数据仓库中的聚合可以为您提供更好的服务。这可以采用创建聚合的视图形式(考虑按小时计算的销售额而不是每个单独的销售),或者您可以通过包含聚合的 CTAS 操作在数据加载时创建永久性 table您的用户通常查询。后一种 CTAS 操作模型是一个简单的 select,具有针对用户的过滤操作(比如总销售额大于今天 - 90 天)。创建视图或报告 table 后,您可以像往常一样简单地连接到 PowerBI。
PowerBI 团队有一个博客 post - Exploring Azure SQL Data Warehouse with PowerBI - 也涵盖了这一点。
您还可以创建一个仅检索所需数据级别(即组、联接、过滤器等)的查询(强力查询 - M)。如果操作正确,查询将转换为 tsql,并且只有有限数量的数据会下载到 power bi designer
我有一个 SQL DW,大约 30 GB。我想使用 PowerBI 来可视化这些数据,但我注意到 PowerBI 桌面 only supports file size up to 250MB。连接到 PowerBI 以可视化此数据的最佳方式是什么?
根据您的用例,您有几个选择:
- 源数据直接查询
- 基于视图的源数据聚合
直接查询
对于较小的数据集(考虑数千行),您可以简单地 connect PowerBI 直接到 Azure SQL 数据仓库并使用 table 视图将数据提取为必要的。
基于视图的聚合
对于更大的数据集(想想数百万、数十亿,甚至数万亿行),运行 数据仓库中的聚合可以为您提供更好的服务。这可以采用创建聚合的视图形式(考虑按小时计算的销售额而不是每个单独的销售),或者您可以通过包含聚合的 CTAS 操作在数据加载时创建永久性 table您的用户通常查询。后一种 CTAS 操作模型是一个简单的 select,具有针对用户的过滤操作(比如总销售额大于今天 - 90 天)。创建视图或报告 table 后,您可以像往常一样简单地连接到 PowerBI。
PowerBI 团队有一个博客 post - Exploring Azure SQL Data Warehouse with PowerBI - 也涵盖了这一点。
您还可以创建一个仅检索所需数据级别(即组、联接、过滤器等)的查询(强力查询 - M)。如果操作正确,查询将转换为 tsql,并且只有有限数量的数据会下载到 power bi designer