Pyspark:如何从周数和年份获取日期

Pyspark: how to get Date from Weeknumber and Year

我有一个数据框,其中有一列包含周数和年份。例如:18/2020,对应2020-04-27的第一个日期。如何提取完整的日期列?

只需使用 to_date with the format w/yyyy :

df = spark.createDataFrame([(1, "18/2020")], ['id', 'week_year'])
df.withColumn("date", to_date(col("week_year"), "w/yyyy")).show()

#+---+---------+----------+
#| id|week_year|      date|
#+---+---------+----------+
#|  1|  18/2020|2020-04-26|
#+---+---------+----------+