聚合键包含数字的键值对的算法
Algorithm to aggregate key-value pairs where keys contain numbers
我会尽力给出完整的问题定义。为了说明这个问题,我稍后会在我的问题中举一个例子。
您可能想先跳转到示例,然后再阅读我的问题定义。
问题
我有一张代表键值对的地图。这些键可能以 -NUMBER
结尾,其中 NUMBER
是一个整数。但是,也可能有不以破折号和数字结尾的键。
前导 -NUMBER
之前的键也可能包含破折号。
可能有多个键以相同的字符串开头并以不同的数字结尾。
也可能有多个以不同字符串开头并以数字结尾的键。
一般情况
- 所有键都是唯一的
- 地图未排序
- 键的顺序是随机的
- 可以安全地假设键中的所有字符串都是大写
- 如果有一个以破折号和一个数字结尾的键
n
大于 一个可以保证所有键都以相同的字符串开头和结尾所有数字 m
和 1 < m
< n
都出现在地图中。
- 最终集合中是否保留以数字结尾的原始密钥无关紧要
关注解决
解决方案不应严格关注优化运行时或空间复杂性,而应关注可读性和可维护性。
地图中最多有大约200个条目,应用程序预计不会有高流量。
例子
输入:
{
"FIRST-KEY" = "FOO",
"SECOND-KEY-3"= "BAZ",
"THIRD-KEY-2" = "BAR",
"SECOND-KEY-1"= "FOO",
"SECOND-KEY-2"= "BAR",
"THIRD-KEY-1" = "FOO"
}
预期输出:
{
"FIRST-KEY" = "FOO",
"SECOND-KEY"= ["FOO", "BAR", "BAZ"],
"THIRD-KEY" = ["FOO", "BAR"]
}
或(如果原始密钥保留在结果中):
{
"FIRST-KEY" = "FOO",
"SECOND-KEY-3"= "BAZ",
"THIRD-KEY-2" = "BAR",
"SECOND-KEY-1"= "FOO",
"SECOND-KEY-2"= "BAR",
"THIRD-KEY-1" = "FOO",
"FIRST-KEY" = "FOO",
"SECOND-KEY" = ["FOO", "BAR", "BAZ"],
"THIRD-KEY" = ["FOO", "BAR"]
}
最后的笔记
我的解决方案必须在 ColdFusion 中实施。
我在问题开头必须称为 map 的输入在 ColdFusion land 中称为 struct。
您可以在 ColdFusion 中制定您的答案(首选脚本语法),但您也可以选择您喜欢的任何其他语言(包括伪代码),只要您不使用我无法使用的其他语言的标准库在 ColdFusion 中。
如果保证所有数字 1 ... n
都存在,一个简单的方法是循环遍历所有键名。对于每个键,使用正则表达式提取 "group" 名称(即 FIRST-KEY
、SECOND-KEY
等...)和 可选 -NUMBER
后缀.
results = {};
for (key in structKeyArray(yourStruct)) {
keyGroup = reReplaceNoCase(key, "(.+)-\d+$", "", "ALL");
insertAt = reReplaceNoCase(key, "[^\d+$]", "", "ALL");
isSequence = insertAt > 0;
// ....
如果数字 > 0,则设置一个布尔标志,指示当前项目是相似键序列的一部分。然后检查你之前是否处理过当前的"group"。如果不是,用一个空数组初始化它。
if (isSequence && !results.keyExists( keyGroup )) {
results[ keyGroup ] = [];
}
最后,存储当前"value"。如果当前项是序列的一部分,则将值插入现有数组。 (由于 -NUMBER
是顺序的,并且从 1
开始,它可以用作数组索引,确保以正确的顺序插入值。)否则,只需将其存储为简单值。
if (isSequence) {
results[ keyGroup ][ insertAt ] = yourStruct[ key ];
}
else {
results[ keyGroup ] = yourStruct[ key ];
}
} // end loop
感谢 Slack 上的 ColdFusion 社区,我们提出了满足我要求的解决方案:
data = data.reduce(function(acc, k, v) {
var lastElement = listLast(k, '-');
if(isNumeric(lastElement)) {
var newKey = reReplace(k, '-\d+$', '');
// init array if not initialized yet
if(!acc.keyExists(newKey)) acc[newKey] = [];
acc[newKey][lastElement] = v;
}
// may be put into an else block. This is only in here to attach the original keys in any case
acc[k] = v;
return acc;
}, {});
IMO 它非常简洁、紧凑和优雅。而且它大部分是不言自明的,可以直观地理解。
这个想法是,整个问题可以归结为一个 reduction。
对于每个元素,我们查看最后一个 "segment"(由 -
分隔),如果它是数字,我们可以为该键构建附加数组。
如果有人不同意或有更好的解决方案,我将非常乐意看到。
我会尽力给出完整的问题定义。为了说明这个问题,我稍后会在我的问题中举一个例子。 您可能想先跳转到示例,然后再阅读我的问题定义。
问题
我有一张代表键值对的地图。这些键可能以 -NUMBER
结尾,其中 NUMBER
是一个整数。但是,也可能有不以破折号和数字结尾的键。
前导 -NUMBER
之前的键也可能包含破折号。
可能有多个键以相同的字符串开头并以不同的数字结尾。
也可能有多个以不同字符串开头并以数字结尾的键。
一般情况
- 所有键都是唯一的
- 地图未排序
- 键的顺序是随机的
- 可以安全地假设键中的所有字符串都是大写
- 如果有一个以破折号和一个数字结尾的键
n
大于 一个可以保证所有键都以相同的字符串开头和结尾所有数字m
和 1 <m
<n
都出现在地图中。 - 最终集合中是否保留以数字结尾的原始密钥无关紧要
关注解决
解决方案不应严格关注优化运行时或空间复杂性,而应关注可读性和可维护性。 地图中最多有大约200个条目,应用程序预计不会有高流量。
例子
输入:
{
"FIRST-KEY" = "FOO",
"SECOND-KEY-3"= "BAZ",
"THIRD-KEY-2" = "BAR",
"SECOND-KEY-1"= "FOO",
"SECOND-KEY-2"= "BAR",
"THIRD-KEY-1" = "FOO"
}
预期输出:
{
"FIRST-KEY" = "FOO",
"SECOND-KEY"= ["FOO", "BAR", "BAZ"],
"THIRD-KEY" = ["FOO", "BAR"]
}
或(如果原始密钥保留在结果中):
{
"FIRST-KEY" = "FOO",
"SECOND-KEY-3"= "BAZ",
"THIRD-KEY-2" = "BAR",
"SECOND-KEY-1"= "FOO",
"SECOND-KEY-2"= "BAR",
"THIRD-KEY-1" = "FOO",
"FIRST-KEY" = "FOO",
"SECOND-KEY" = ["FOO", "BAR", "BAZ"],
"THIRD-KEY" = ["FOO", "BAR"]
}
最后的笔记
我的解决方案必须在 ColdFusion 中实施。 我在问题开头必须称为 map 的输入在 ColdFusion land 中称为 struct。
您可以在 ColdFusion 中制定您的答案(首选脚本语法),但您也可以选择您喜欢的任何其他语言(包括伪代码),只要您不使用我无法使用的其他语言的标准库在 ColdFusion 中。
如果保证所有数字 1 ... n
都存在,一个简单的方法是循环遍历所有键名。对于每个键,使用正则表达式提取 "group" 名称(即 FIRST-KEY
、SECOND-KEY
等...)和 可选 -NUMBER
后缀.
results = {};
for (key in structKeyArray(yourStruct)) {
keyGroup = reReplaceNoCase(key, "(.+)-\d+$", "", "ALL");
insertAt = reReplaceNoCase(key, "[^\d+$]", "", "ALL");
isSequence = insertAt > 0;
// ....
如果数字 > 0,则设置一个布尔标志,指示当前项目是相似键序列的一部分。然后检查你之前是否处理过当前的"group"。如果不是,用一个空数组初始化它。
if (isSequence && !results.keyExists( keyGroup )) {
results[ keyGroup ] = [];
}
最后,存储当前"value"。如果当前项是序列的一部分,则将值插入现有数组。 (由于 -NUMBER
是顺序的,并且从 1
开始,它可以用作数组索引,确保以正确的顺序插入值。)否则,只需将其存储为简单值。
if (isSequence) {
results[ keyGroup ][ insertAt ] = yourStruct[ key ];
}
else {
results[ keyGroup ] = yourStruct[ key ];
}
} // end loop
感谢 Slack 上的 ColdFusion 社区,我们提出了满足我要求的解决方案:
data = data.reduce(function(acc, k, v) {
var lastElement = listLast(k, '-');
if(isNumeric(lastElement)) {
var newKey = reReplace(k, '-\d+$', '');
// init array if not initialized yet
if(!acc.keyExists(newKey)) acc[newKey] = [];
acc[newKey][lastElement] = v;
}
// may be put into an else block. This is only in here to attach the original keys in any case
acc[k] = v;
return acc;
}, {});
IMO 它非常简洁、紧凑和优雅。而且它大部分是不言自明的,可以直观地理解。
这个想法是,整个问题可以归结为一个 reduction。
对于每个元素,我们查看最后一个 "segment"(由 -
分隔),如果它是数字,我们可以为该键构建附加数组。
如果有人不同意或有更好的解决方案,我将非常乐意看到。