如何启用 Databricks Delta 功能

How to enable Databricks Delta feature

将我的 Azure Databricks 从标准升级到主要,尝试开始使用 Databricks Delta:

create table t
using delta
as select * from test_db.src_data;

Databricks Delta is not enabled in your account. Please reach out to your account manager to talk about using Delta;

我是客户经理,但找不到此设置。它在哪里?

  1. ipynbscala 笔记本中使用 Spark SQL 上下文:

sql("SET spark.databricks.delta.preview.enabled=true")

sql("SET spark.databricks.delta.merge.joinBasedMerge.enabled = true")

  1. SQL dbc notebooks中:

SET spark.databricks.delta.preview.enabled=true

SET spark.databricks.delta.merge.joinBasedMerge.enabled

  1. 当你想要 default the cluster to support Delta 时,同时在 parameters for Environment variables last column 中的 UI 上启动集群

就这一行:spark.databricks.delta.preview.enabled=true

  1. 或者最后也是最后一个有趣的部分。当你旋转你的集群时 Select 5.0 or above 我们应该默认为这些人启用 Delta。

最后欢迎来到 Databricks Delta :)

此外,为了帮助您解决您的代码问题,它应该如下所示

%sql create table t as select * from test_db.src_data USING DELTA PARTITIONED BY (YourPartitionColumnHere) LOCATION "/mnt/data/path/to/the/location/where/you/want/these/parquetFiles/to/be/present"