如何删除数据框列中的 space 并向其添加字符串 "NA" ?

How to remove the space in a column of dataframe and add string "NA" to it?

我有一个数据框 (df),如下所示。但是在 sensortype 列中,我有一个字段是空白的。我想用字符串“na”替换它。怎么做?

+----------+-------+
|sensortype|offline|
+----------+-------+
|Sensor1   |2      |
|Sensor1   |0      |
|          |2      |
+----------+-------+

我试过了,但没用:

df.withColumn("sensortype",regexp_replace(col("sensortype"),"\s+","NA"))

这应该有效:

df.withColumn("sensortype", when(length(col("sensortype"))===0,"NA")
.otherwise(col("sensortype")))

尝试将模式字符串 \s+ 替换为 ^\s*$