使用 PySpark 将列转换为小写

Convert column to lowercase with PySpark

我想将 "Channel" 列中的所有值都转换为小写。我在 jupyter notebook 中使用 PySpark 创建了 df。我尝试了 中的代码,但出现错误。所以它不是重复的。

我的数据是这样的:

id     Channel     Brand
123    Hair        Fashion
124    Nails       Fashion 

我希望它是以下内容:

id     Channel     Brand
123    hair        Fashion
124    nails       Fashion 

我试过以下方法:

new_df = df.select(lower(df.Channel)).alias('Channel')

将值转换为小写,但我丢失了其他列。

你只需要做:

new_df = df.withColumn('Channel', lower(df.Channel))

这也将保留其他列。