从字符串到 Hive 中的映射对象

from string to map object in Hive

我的输入是一个字符串,可以包含从 A 到 Z 的任何字符(没有重复,因此最多可以包含 26 个字符)。

例如:-

set Input='ATK';

字符串中的字符可以任意顺序出现。

现在我想从中创建一个地图对象,其中包含来自 A[= 的 fixed 键36=] 到 Z。如果键的对应字符出现在输入字符串中,则该键的值为 1。所以在这个例子(ATK)的情况下,地图对象应该是这样的:-

那么最好的方法是什么?

所以代码应该是这样的:-

set Input='ATK';
select <some logic>;

它应该return 一个地图对象 (Map<string,int>),其中包含 26 个键值对。最好的方法是什么,而无需在 Hive 中创建任何用户定义的函数。我知道有一个函数 str_to_map 很容易达到 mind.But 它只有在源字符串中存在键值对时才有效,而且它只会考虑键值输入中指定的对。

可能效率不高但有效:

select str_to_map(concat_ws('&',collect_list(concat_ws(":",a.dict,case when 
b.character is null then '0' else '1' end))),'&',':')
from 
(
   select explode(split("A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y,Z",',')) as dict
) a 
left join
(
   select explode(split(${hiveconf:Input},'')) as character
) b 
on a.dict = b.character

结果:

{"A":"1","B":"0","C":"0","D":"0","E":"0","F":"0","G":"0","H":"0","I":"0","J":"0","K":"1","L":"0","M":"0","N":"0","O":"0","P":"0","Q":"0","R":"0","S":"0","T":"1","U":"0","V":"0","W":"0","X":"0","Y":"0","Z":"0"}