Hive 拆分函数到 select 最后一组

Hive Split function to select last group

我想拆分 URL 结构,我只对拆分的最后一部分感兴趣。 例如

www.example.com/subdirect/mainpage.aspx
www.example.com/mainpage4.aspx
www.example.com/subdirect/subdiret/subdirect2/mainpage2.aspx

这里我只想要 aspx 页面而不是之前的内容,即我只想 return 下面的文本

mainpage.aspx
mainpage4.aspx
mainpage2.aspx

我尝试使用拆分,但我不确定如何仅 return 动态地 URL 结构的最后一部分。有任何想法吗? 这是我正在尝试的脚本

select split(URL,'/')[MAX] from URLlist

这是一个使用regexp_extract

的解决方案
select regexp_extract(URL, '.*/([^/]+)$', 1) from URLlist

这将匹配并捕获最后一个 / 字符后的所有内容