Pyspark 替换?在数据中

Pyspark2 replace ? in data

我有问号“?”在我的数据中。在我名为 "Name" 的专栏中。这些问号“?”在我的数据中充当空值。我该如何更换?与南。

使用pyspark2,我试过了

from pyspark.sql.functions import regexp_replace, col

data = data.select(regexp_replace(col("Name"), "?", "NaN"))

是否有其他使用用户定义函数的方法?

字符“?”在正则表达式中有特殊含义。使用转义序列。希望这有帮助,

data = data.select(regexp_replace(col("Name"), "\?", "NaN"))