Collectors.groupingBy 的自定义收集器未按预期工作

Custom Collector for Collectors.groupingBy doesn't work as expected

考虑简单的 class Foo:

public class Foo {

    public Float v1;
    public Float v2;
    public String name;

    public Foo(String name, Float v1, Float v2) {
        this.name = name;
        this.v1 = v1;
        this.v2 = v2;
    }

    public String getName() {
        return name;
    }
}

现在,我有一个 Foo 的集合,我想按 Foo::getName 对它们进行分组。我编写了一个自定义收集器来执行此操作,但它似乎没有按预期工作。更准确地说,combiner() 永远不会被调用。为什么?

public class Main {

    public static void main(String[] args) {

        List<Foo> foos = new ArrayList<>();
        foos.add(new Foo("blue", 2f, 2f));
        foos.add(new Foo("blue", 2f, 3f));
        foos.add(new Foo("green", 3f, 4f));

        Map<String, Float> fooGroups = foos.stream().collect(Collectors.groupingBy(Foo::getName, new FooCollector()));
        System.out.println(fooGroups);
    }

    private static class FooCollector implements Collector<Foo, Float, Float> {

        @Override
        public Supplier<Float> supplier() {
            return () -> new Float(0);
        }

        @Override
        public BiConsumer<Float, Foo> accumulator() {
            return (v, foo) -> v += foo.v1 * foo.v2;
        }

        @Override
        public BinaryOperator<Float> combiner() {
            return (v1, v2) -> v1 + v2;
        }

        @Override
        public Function<Float, Float> finisher() {
            return Function.identity();
        }

        @Override
        public Set<Characteristics> characteristics() {
            Set<Characteristics> characteristics = new TreeSet<>();
            return characteristics;
        }
    }
}

首先,如果您不使用多线程(并行流),则不需要调用组合器函数。组合器被调用以组合对流的块的操作结果。这里没有并行性,所以不需要调用组合器。

由于累加器函数,您得到的值为零。表达式

v += foo.v1 * foo.v2;

用新的Float对象替换v。原始累加器对象没有被修改;它仍然是 0f。此外,Float 与其他数字包装类型(和 String)一样是不可变的,无法更改。

您需要一些其他类型的可变累加器对象。

class FloatAcc {
    private Float total;
    public FloatAcc(Float initial) {
        total = initial;
    }
    public void accumulate(Float item) {
        total += item;
    }
    public Float get() {
        return total;
    }
}

然后您可以修改您的自定义 Collector 以使用 FloatAcc。提供一个新的 FloatAcc,在 accumulator 函数中调用 accumulate,等等

class FooCollector implements Collector<Foo, FloatAcc, Float> {
    @Override
    public Supplier<FloatAcc> supplier() {
        return () -> new FloatAcc(0f);
    }
    @Override
    public BiConsumer<FloatAcc, Foo> accumulator() {
        return (v, foo) -> v.accumulate(foo.v1 * foo.v2);
    }
    @Override
    public BinaryOperator<FloatAcc> combiner() {
        return (v1, v2) -> {
            v1.accumulate(v2.get());
            return v1;
        };
    }
    @Override
    public Function<FloatAcc, Float> finisher() {
        return FloatAcc::get;
    }
    @Override
    public Set<Characteristics> characteristics() {
        Set<Characteristics> characteristics = new TreeSet<>();
        return characteristics;
    }
}

通过这些更改,我得到了您所期望的:

{green=12.0, blue=10.0}

你有一个关于为什么电流收集器从 开始不工作的解释。

值得检查一下存在哪些辅助方法来创建自定义收集器。例如,整个收集器可以更简洁地定义为:

reducing(0.f, v -> v.v1 * v.v2, (a, b) -> a + b)

并不总是可以使用这些方法;但简洁(而且,大概是经过充分测试)应该使它们成为可能的首选。