Hive 拆分函数到 select 最后一组
Hive Split function to select last group
我想拆分 URL 结构,我只对拆分的最后一部分感兴趣。
例如
www.example.com/subdirect/mainpage.aspx
www.example.com/mainpage4.aspx
www.example.com/subdirect/subdiret/subdirect2/mainpage2.aspx
这里我只想要 aspx 页面而不是之前的内容,即我只想 return 下面的文本
mainpage.aspx
mainpage4.aspx
mainpage2.aspx
我尝试使用拆分,但我不确定如何仅 return 动态地 URL 结构的最后一部分。有任何想法吗?
这是我正在尝试的脚本
select split(URL,'/')[MAX] from URLlist
这是一个使用regexp_extract
的解决方案
select regexp_extract(URL, '.*/([^/]+)$', 1) from URLlist
这将匹配并捕获最后一个 /
字符后的所有内容
我想拆分 URL 结构,我只对拆分的最后一部分感兴趣。 例如
www.example.com/subdirect/mainpage.aspx
www.example.com/mainpage4.aspx
www.example.com/subdirect/subdiret/subdirect2/mainpage2.aspx
这里我只想要 aspx 页面而不是之前的内容,即我只想 return 下面的文本
mainpage.aspx
mainpage4.aspx
mainpage2.aspx
我尝试使用拆分,但我不确定如何仅 return 动态地 URL 结构的最后一部分。有任何想法吗? 这是我正在尝试的脚本
select split(URL,'/')[MAX] from URLlist
这是一个使用regexp_extract
select regexp_extract(URL, '.*/([^/]+)$', 1) from URLlist
这将匹配并捕获最后一个 /
字符后的所有内容