regexp_replace HIVE 中的函数

regexp_replace function in HIVE

如何使用 HIVE 中的 regexp_replace 函数从该字符串中剪切标记:

Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a> 

我想得到:abc abc abc abc abc 有人知道吗?

假设列 WTF 包含

Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a>

然后 regexp_replace(regexp_replace(WTF,'<[^>]*>',''), '[",.]','') 删除所有 XML 标记内容,然后是标点符号,到 return

Abc abc abc abc abc

那是普通的旧正则表达式语法,与 Hive 无关。