删除 space 之后的所有内容 - Pyspark
Remove everything after a space - Pyspark
我有一个数据框 df 如下:
A B
21k2 b 1
2412 9 p
A和B都是字符串。
我希望按如下方式修剪 A 列元素:
A B
21k2 1
2412 p
如果您还可以展示如何删除 space 之前的任何内容,将加分感谢。
您可以使用split
函数和getItem
方法。
df = df.select(F.split('A', ' ').getItem(0).alias('A'), 'B')
我有一个数据框 df 如下:
A B
21k2 b 1
2412 9 p
A和B都是字符串。
我希望按如下方式修剪 A 列元素:
A B
21k2 1
2412 p
如果您还可以展示如何删除 space 之前的任何内容,将加分感谢。
您可以使用split
函数和getItem
方法。
df = df.select(F.split('A', ' ').getItem(0).alias('A'), 'B')