Databricks Lakehouse JDBC 和 Docker

Databricks Lakehouse JDBC and Docker

Databricks 的新手。 我需要使用 JDBC 驱动程序访问 Lakehouse 中的数据。这很好用。

我现在想使用 docker 图像对 Lakehouse 进行存根,以进行一些我想编写的测试。是否可以获取带有数据库的 Databricks / spark docker 图像?我还想 bootstrap 数据库在启动时创建一堆表。

否 - Databricks 不是数据库,而是托管服务 (PaaS)。从理论上讲,您可以在启动 Thriftserver 的情况下使用 OSS Spark,但连接字符串和其他功能会非常不同,因此花时间在上面没有意义(恕我直言)。真正的解决方案取决于您要执行的测试类型。

关于引导数据库和创建一堆表 - 只需在应用程序启动时发出这些命令,例如 create database if not existscreate table if not exists(有关确切语法,请参阅 documentation