聚合键包含数字的键值对的算法

Algorithm to aggregate key-value pairs where keys contain numbers

我会尽力给出完整的问题定义。为了说明这个问题,我稍后会在我的问题中举一个例子。 您可能想先跳转到示例,然后再阅读我的问题定义。

问题

我有一张代表键值对的地图。这些键可能以 -NUMBER 结尾,其中 NUMBER 是一个整数。但是,也可能有不以破折号和数字结尾的键。

前导 -NUMBER 之前的键也可能包含破折号。

可能有多个键以相同的字符串开头并以不同的数字结尾。

也可能有多个以不同字符串开头并以数字结尾的键。

一般情况

  1. 所有键都是唯一的
  2. 地图未排序
  3. 键的顺序是随机的
  4. 可以安全地假设键中的所有字符串都是大写
  5. 如果有一个以破折号和一个数字结尾的键 n 大于 一个可以保证所有键都以相同的字符串开头和结尾所有数字 m 和 1 < m < n 都出现在地图中。
  6. 最终集合中是否保留以数字结尾的原始密钥无关紧要

关注解决

解决方案不应严格关注优化运行时或空间复杂性,而应关注可读性和可维护性。 地图中最多有大约200个条目,应用程序预计不会有高流量。

例子

输入:

{
    "FIRST-KEY"   = "FOO",
    "SECOND-KEY-3"= "BAZ",
    "THIRD-KEY-2" = "BAR",
    "SECOND-KEY-1"= "FOO",
    "SECOND-KEY-2"= "BAR",
    "THIRD-KEY-1" = "FOO"
}

预期输出:

{
    "FIRST-KEY" = "FOO",
    "SECOND-KEY"= ["FOO", "BAR", "BAZ"],
    "THIRD-KEY" = ["FOO", "BAR"]
}

或(如果原始密钥保留在结果中):

{
    "FIRST-KEY"   = "FOO",
    "SECOND-KEY-3"= "BAZ",
    "THIRD-KEY-2" = "BAR",
    "SECOND-KEY-1"= "FOO",
    "SECOND-KEY-2"= "BAR",
    "THIRD-KEY-1" = "FOO",
    "FIRST-KEY"   = "FOO",
    "SECOND-KEY"  = ["FOO", "BAR", "BAZ"],
    "THIRD-KEY"   = ["FOO", "BAR"]
}

最后的笔记

我的解决方案必须在 ColdFusion 中实施。 我在问题开头必须称为 map 的输入在 ColdFusion land 中称为 struct

您可以在 ColdFusion 中制定您的答案(首选脚本语法),但您也可以选择您喜欢的任何其他语言(包括伪代码),只要您不使用我无法使用的其他语言的标准库在 ColdFusion 中。

如果保证所有数字 1 ... n 都存在,一个简单的方法是循环遍历所有键名。对于每个键,使用正则表达式提取 "group" 名称(即 FIRST-KEYSECOND-KEY 等...)和 可选 -NUMBER 后缀.

results = {};

for (key in structKeyArray(yourStruct)) {

   keyGroup  = reReplaceNoCase(key, "(.+)-\d+$", "", "ALL");
   insertAt  = reReplaceNoCase(key, "[^\d+$]", "", "ALL");
   isSequence = insertAt > 0;

   // ....

如果数字 > 0,则设置一个布尔标志,指示当前项目是相似键序列的一部分。然后检查你之前是否处理过当前的"group"。如果不是,用一个空数组初始化它。

    if (isSequence && !results.keyExists( keyGroup )) {
        results[ keyGroup ] = [];
    }

最后,存储当前"value"。如果当前项是序列的一部分,则将值插入现有数组。 (由于 -NUMBER 是顺序的,并且从 1 开始,它可以用作数组索引,确保以正确的顺序插入值。)否则,只需将其存储为简单值。

    if (isSequence) {
        results[ keyGroup ][ insertAt ] = yourStruct[ key ];
    }
    else {
        results[ keyGroup ] = yourStruct[ key ];
    }

 } // end loop

感谢 Slack 上的 ColdFusion 社区,我们提出了满足我要求的解决方案:

data = data.reduce(function(acc, k, v) {
    var lastElement = listLast(k, '-');
    if(isNumeric(lastElement)) {
        var newKey = reReplace(k, '-\d+$', '');
        // init array if not initialized yet
        if(!acc.keyExists(newKey)) acc[newKey] = [];
        acc[newKey][lastElement] = v;
    }

    // may be put into an else block. This is only in here to attach the original keys in any case
    acc[k] = v;

    return acc;
}, {});

IMO 它非常简洁、紧凑和优雅。而且它大部分是不言自明的,可以直观地理解。

这个想法是,整个问题可以归结为一个 reduction。 对于每个元素,我们查看最后一个 "segment"(由 - 分隔),如果它是数字,我们可以为该键构建附加数组。

如果有人不同意或有更好的解决方案,我将非常乐意看到。

最后感谢大家的付出Ageax, Credits for the solution go to rodel30