regexp_replace HIVE 中的函数
regexp_replace function in HIVE
如何使用 HIVE 中的 regexp_replace 函数从该字符串中剪切标记:
Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a>
我想得到:abc abc abc abc abc
有人知道吗?
假设列 WTF 包含
Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a>
然后 regexp_replace(regexp_replace(WTF,'<[^>]*>',''), '[",.]','')
删除所有 XML 标记内容,然后是标点符号,到 return
Abc abc abc abc abc
那是普通的旧正则表达式语法,与 Hive 无关。
如何使用 HIVE 中的 regexp_replace 函数从该字符串中剪切标记:
Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a>
我想得到:abc abc abc abc abc 有人知道吗?
假设列 WTF 包含
Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a>
然后 regexp_replace(regexp_replace(WTF,'<[^>]*>',''), '[",.]','')
删除所有 XML 标记内容,然后是标点符号,到 return
Abc abc abc abc abc
那是普通的旧正则表达式语法,与 Hive 无关。