如何在 Foundry 代码工作簿中将字符串列(具有 4 位年份值)转换为 DATE 类型?

How do you convert a string column (with 4-digit year values) to a DATE type in Foundry Code Workbooks?

有没有办法将具有 4 位年份值的列转换为 DATE 类型并让它在 Foundry 中这样显示?

现在,我正在处理一个名为 year 的列,其中包含如下值:1999, 2001, 2010,其类型为 STRING。

当我编写代码将其转换为日期时,它将 4 位数字的年份转换为 10 位数字的年、月和日期,就像这样 2010-01-01

这是我试过的一些代码:

  1. df = df.withColumn('year_mfr', F.trunc(df.year_mfr, 'yyyy'))
  2. df = df.withColumn('year_mfr', F.to_date(df.year_mfr, 'yyyy'))

spark 中的日期类型定义为 10 位数字年月日,因此很遗憾无法截断它...

https://spark.apache.org/docs/1.5.0/api/java/org/apache/spark/sql/types/DateType.html

解决此问题的方法是将年份转换为整数。