使用 python 在 Databricks 中截断增量 table
Truncate delta table in Databricks using python
Delta table删除操作给出here for Python and SQL. Truncate using SQL is given here。但是找不到 Python 截断 table 的文档。如何在 Databricks 中为 delta table 做到这一点?
并非所有内容都作为 Python 或 Java/Scala 的函数公开。有些操作是 SQL-only,例如 OPTIMIZE
。如果你想截断table,你有两个选择:
- 使用
spark.sql("TRUNCATE TABLE <name>")
或
spark.sql("TRUNCATE TABLE delta.`<path>`")
- 在覆盖模式下使用读+写空数据帧模拟截断:
df = spark.read.format("delta").load("<path>")
df.limit(0).write.mode("overwrite").format("delta").save("<path>")
Delta table删除操作给出here for Python and SQL. Truncate using SQL is given here。但是找不到 Python 截断 table 的文档。如何在 Databricks 中为 delta table 做到这一点?
并非所有内容都作为 Python 或 Java/Scala 的函数公开。有些操作是 SQL-only,例如 OPTIMIZE
。如果你想截断table,你有两个选择:
- 使用
spark.sql("TRUNCATE TABLE <name>")
或
spark.sql("TRUNCATE TABLE delta.`<path>`")
- 在覆盖模式下使用读+写空数据帧模拟截断:
df = spark.read.format("delta").load("<path>")
df.limit(0).write.mode("overwrite").format("delta").save("<path>")