计算 Hash<String,List<String>> 中 List 中项目值的出现次数

Counting occurrences of values of items inside a List within a Hash<String,List<String>>

我有一个散列结构 hash_feat <String, List<String>>,其中我的 keysYearsvalues 里面的列表有不同术语的列表。

我的哈希已经以某种方式拥有,来自特定 的所有项目都在该键的同一个列表中,例如:

<1997> <A,B,C,A,A,A,B,C,C,E> <2003> <C,C,C,A,B,A,D,D,D,A> <2004> <A,C,C,X,X,A,K,T,T,T>

我想对每件商品进行计数。对于 1997 A:4、B:2、C:3、E:1 等等,其他

我试图想出这个来使用这个 "counting" 稍后显示在一个图中,我可以在图中可视化每个项目的最高计数。可能这不是最聪明的方法,所以欢迎任何建议,因为 well.The 想法是在我的列表中包含每个项目的数量,这样我就可以 manipulate/use 在其他方法中。

有没有人有好的建议来巧妙地做到这一点?

希望目前你有类似的东西:

Map<String,List<String>> map = new HashMap<>();

因此您可以遍历所有键并获取每个键的计数,如下所示:

for (List<String> values : map.values()){
    System.out.println(values.size());
}

如果您需要键内每种类型的计数,则必须使用 values.get() 检查类型并计算每种类型。

这是 Java 8 的 "simple" 解决方案:

import static java.util.stream.Collectors.*;

Map<String, Map<String, Long>> props =
  map.entrySet().stream().collect(toMap(Map.Entry::getKey,
    e -> e.getValue().stream().collect(groupingBy(String::toString, counting()))));

这将为您提供一个年份映射到计数键映射。

Eclipse Collections called BagMultimap that would would work well with your use case. Here is how to leverage MutableBagMultimap 中有一个数据结构与您的示例数据。

MutableBagMultimap<String, String> multimap = Multimaps.mutable.bag.empty();
multimap.putAll("1997", Lists.mutable.with("A","B","C","A","A","A","B","C","C","E"));
multimap.putAll("2003", Lists.mutable.with("C","C","C","A","B","A","D","D","D","A"));
multimap.putAll("2004", Lists.mutable.with("A","C","C","X","X","A","K","T","T","T"));

Assert.assertEquals(4, multimap.get("1997").occurrencesOf("A"));
Assert.assertEquals(2, multimap.get("1997").occurrencesOf("B"));
Assert.assertEquals(3, multimap.get("1997").occurrencesOf("C"));
Assert.assertEquals(1, multimap.get("1997").occurrencesOf("E"));

您可以简单地使用forEachKeyMultivaluestoStringOfItemToCount输出多图。

multimap.forEachKeyMultiValues((key, values) ->
    System.out.println("<" + key + "> " + ((Bag<String>)values).toStringOfItemToCount()));

此代码显示以下内容:

<1997> {E=1, A=4, B=2, C=3}
<2004> {T=3, A=2, C=2, X=2, K=1}
<2003> {D=3, A=3, B=1, C=3}

或者您可以使用 forEachWithOccurrences 编写以下内容以控制输出。

multimap.forEachKey(key -> {
    System.out.print(key + " ");
    multimap.get(key).forEachWithOccurrences((value, occurrences) ->
        System.out.print(value + ":" + occurrences + " "));
    System.out.println();
});

此代码显示以下内容:

1997 E:1 A:4 B:2 C:3 
2004 T:3 A:2 C:2 X:2 K:1 
2003 D:3 A:3 B:1 C:3  

最后,如果您希望输出从出现次数最多的到最少的顺序排列,您可以使用 topOccurrences

multimap.forEachKey(key -> {
    System.out.print(key + " ");
    MutableBag<String> bag = multimap.get(key);
    bag.topOccurrences(bag.sizeDistinct())
        .each(pair ->
            System.out.print(pair.getOne() + ":" + pair.getTwo() + " "));
    System.out.println();
});

此代码显示以下内容:

1997 A:4 C:3 B:2 E:1 
2004 T:3 A:2 C:2 X:2 K:1 
2003 D:3 A:3 C:3 B:1 

注意:我是 Eclipse Collections 的提交者