Pyspark:如何从周数和年份获取日期
Pyspark: how to get Date from Weeknumber and Year
我有一个数据框,其中有一列包含周数和年份。例如:18/2020
,对应2020-04-27
的第一个日期。如何提取完整的日期列?
只需使用 to_date
with the format w/yyyy
:
df = spark.createDataFrame([(1, "18/2020")], ['id', 'week_year'])
df.withColumn("date", to_date(col("week_year"), "w/yyyy")).show()
#+---+---------+----------+
#| id|week_year| date|
#+---+---------+----------+
#| 1| 18/2020|2020-04-26|
#+---+---------+----------+
我有一个数据框,其中有一列包含周数和年份。例如:18/2020
,对应2020-04-27
的第一个日期。如何提取完整的日期列?
只需使用 to_date
with the format w/yyyy
:
df = spark.createDataFrame([(1, "18/2020")], ['id', 'week_year'])
df.withColumn("date", to_date(col("week_year"), "w/yyyy")).show()
#+---+---------+----------+
#| id|week_year| date|
#+---+---------+----------+
#| 1| 18/2020|2020-04-26|
#+---+---------+----------+