Connecting/Accessing 通过 Power BI 上的 Spark Thrift 服务器获取 Hive 数据

Connecting/Accessing Hive data through Spark Thrift server on Power BI

我对多个平台上的数据连接比较陌生,我的要求很简单,我需要能够通过 Power BI 访问 Spark Thrift 服务器,有人可以指导我完成相同的必要步骤吗?

我必须集成相当多的大数据和分析工具,并且有丰富的 spark 经验

通常我会在 tableau 文档中查找它 https://onlinehelp.tableau.com/current/pro/desktop/en-us/examples_sparksql.html

或该工具的文档
https://powerbi.microsoft.com/en-us/blog/power-bi-desktop-november-feature-summary/#spark

但我偏爱这些文档
https://github.com/oracle/learning-library/blob/master/workshops/journey2-new-data-lake/files/18.1.4/pdf/Connecting%20DVD3%20and%20Spark.pdf

您需要确保已 spark-thift 启动并侦听开放端口。然后您将需要不同的信息和您使用的连接类型 (jdbc, odbc...)

这是假设您有 DirectQuery 的预览版
https://docs.microsoft.com/en-us/power-bi/desktop-directquery-data-sources