删除 space 之后的所有内容 - Pyspark

Remove everything after a space - Pyspark

我有一个数据框 df 如下:

    A               B
  21k2 b            1
  2412 9            p

A和B都是字符串。

我希望按如下方式修剪 A 列元素:

  A               B
21k2              1
2412              p

如果您还可以展示如何删除 space 之前的任何内容,将加分感谢。

您可以使用split函数和getItem方法。

df = df.select(F.split('A', ' ').getItem(0).alias('A'), 'B')