如何删除数据框列中的 space 并向其添加字符串 "NA" ?
How to remove the space in a column of dataframe and add string "NA" to it?
我有一个数据框 (df),如下所示。但是在 sensortype 列中,我有一个字段是空白的。我想用字符串“na”替换它。怎么做?
+----------+-------+
|sensortype|offline|
+----------+-------+
|Sensor1 |2 |
|Sensor1 |0 |
| |2 |
+----------+-------+
我试过了,但没用:
df.withColumn("sensortype",regexp_replace(col("sensortype"),"\s+","NA"))
这应该有效:
df.withColumn("sensortype", when(length(col("sensortype"))===0,"NA")
.otherwise(col("sensortype")))
尝试将模式字符串 \s+
替换为 ^\s*$
我有一个数据框 (df),如下所示。但是在 sensortype 列中,我有一个字段是空白的。我想用字符串“na”替换它。怎么做?
+----------+-------+
|sensortype|offline|
+----------+-------+
|Sensor1 |2 |
|Sensor1 |0 |
| |2 |
+----------+-------+
我试过了,但没用:
df.withColumn("sensortype",regexp_replace(col("sensortype"),"\s+","NA"))
这应该有效:
df.withColumn("sensortype", when(length(col("sensortype"))===0,"NA")
.otherwise(col("sensortype")))
尝试将模式字符串 \s+
替换为 ^\s*$