使用 PySpark 将列转换为小写
Convert column to lowercase with PySpark
我想将 "Channel" 列中的所有值都转换为小写。我在 jupyter notebook 中使用 PySpark 创建了 df
。我尝试了 中的代码,但出现错误。所以它不是重复的。
我的数据是这样的:
id Channel Brand
123 Hair Fashion
124 Nails Fashion
我希望它是以下内容:
id Channel Brand
123 hair Fashion
124 nails Fashion
我试过以下方法:
new_df = df.select(lower(df.Channel)).alias('Channel')
将值转换为小写,但我丢失了其他列。
你只需要做:
new_df = df.withColumn('Channel', lower(df.Channel))
这也将保留其他列。
我想将 "Channel" 列中的所有值都转换为小写。我在 jupyter notebook 中使用 PySpark 创建了 df
。我尝试了
我的数据是这样的:
id Channel Brand
123 Hair Fashion
124 Nails Fashion
我希望它是以下内容:
id Channel Brand
123 hair Fashion
124 nails Fashion
我试过以下方法:
new_df = df.select(lower(df.Channel)).alias('Channel')
将值转换为小写,但我丢失了其他列。
你只需要做:
new_df = df.withColumn('Channel', lower(df.Channel))
这也将保留其他列。