Pyspark 替换?在数据中
Pyspark2 replace ? in data
我有问号“?”在我的数据中。在我名为 "Name" 的专栏中。这些问号“?”在我的数据中充当空值。我该如何更换?与南。
使用pyspark2,我试过了
from pyspark.sql.functions import regexp_replace, col
data = data.select(regexp_replace(col("Name"), "?", "NaN"))
是否有其他使用用户定义函数的方法?
字符“?”在正则表达式中有特殊含义。使用转义序列。希望这有帮助,
data = data.select(regexp_replace(col("Name"), "\?", "NaN"))
我有问号“?”在我的数据中。在我名为 "Name" 的专栏中。这些问号“?”在我的数据中充当空值。我该如何更换?与南。
使用pyspark2,我试过了
from pyspark.sql.functions import regexp_replace, col
data = data.select(regexp_replace(col("Name"), "?", "NaN"))
是否有其他使用用户定义函数的方法?
字符“?”在正则表达式中有特殊含义。使用转义序列。希望这有帮助,
data = data.select(regexp_replace(col("Name"), "\?", "NaN"))