如何使用 spark 读取某些镶木地板文件分区？

How to read certain parquet file partitions using spark?

是否可以使用 spark 从文件夹中读取某些分区？

我只知道这样： df = spark.read.parquet("/mnt/Staging/file_Name/")

有没有办法只读取日期不小于今天减3个月的那些分区？

如果你的数据框是按日期分区的，你可以只使用过滤器，spark 将只读取这个日期的分区

df = spark.read.parquet("/mnt/Staging/file_Name/").filter(col("your_date_col") === "2022-02-03")