pyspark 中用于检查字母和 space 的正则表达式(也适用于 uni 代码)

Regular expression in pyspark to check alphabets and space (Also work with uni codes)

我需要一个在 table.

以下验证的正则表达式

它应该 return 只有当字符串包含字母或带有 space 的字母时才有效。

我尝试了以下代码,但它不允许 space。

r = "\A\pL+\z"

Result_Name = Name_NotNull.withColumn("Name_Alphabets_Valid", when(col("first").rlike(r), lit("valid")).otherwise(lit("Invalid")))

尝试使用除字母字符外还允许空格的字符 class:

r = "\A[\pL\s]+\z"