为什么 .toString() 似乎修复了 StringBuilder 的 OutOfMemoryError 异常?

Why does .toString() seem to fix an OutOfMemoryError exception for StringBuilder?

我正在学习如何使用 JMH 进行微基准测试。我从看似简单的事情开始:StringBuilderString +=.

的字符串连接

根据我的理解,我应该创建一个包含 StringBuilder 实例的 State 对象,因为我不想对其构造函数进行基准测试(我也不希望每次迭代都为空反正)。 String += 测试也是如此 - 我希望 State 中的 String 对象与新字符串连接。

这是我的代码:

@State(Scope.Thread)
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
public class Test {

    @State(Scope.Thread)
    public static class BenchmarkState {

        public StringBuilder    builder;
        public String           regularString;

        @Setup(Level.Iteration)
        public void setup() {
            builder         = new StringBuilder();
            regularString   = "";
        }

    }

    @Benchmark
    public String stringTest(BenchmarkState state) {
        state.regularString += "hello";
        return state.regularString;
    }

    @Benchmark
    public String stringBuilderTest(BenchmarkState state) {
        state.builder.append("hello");
        return state.builder.toString();
    }

    public static void main(String[] args) throws RunnerException {
        Options opt = new OptionsBuilder()
                .include(Test.class.getSimpleName())
                .forks(1)
                .timeUnit(TimeUnit.MILLISECONDS)
                .mode(Mode.Throughput)
                .measurementTime(TimeValue.seconds(10))
                .build();

        new Runner(opt).run();
    }

}

它有效,但我在想 - 我不想在每次迭代结束时调用 .toString()。我只测试串联。所以我决定通过返回 null 来删除它。

但是,这发生在第一次预热迭代期间:

java.lang.OutOfMemoryError: Java heap space
    at java.util.Arrays.copyOf(Arrays.java:3332)
    at java.lang.AbstractStringBuilder.ensureCapacityInternal(AbstractStringBuilder.java:124)
    at java.lang.AbstractStringBuilder.append(AbstractStringBuilder.java:448)
    at java.lang.StringBuilder.append(StringBuilder.java:136)

我知道如果 JMH 尽可能快地附加到 StringBuilder,我会很快 运行 内存不足,所以我对 OutOfMemoryError 问题并不感到惊讶.但是我不明白为什么 builder.toString() 会修复它。

所以我的问题是:

调用 toString() 需要时间,并且会产生垃圾,需要运行 GC,进一步降低代码速度。

由于测试有时间限制,这些减速可能会导致测试在消耗所有内存之前停止。如果您增加时间限制,即使使用 toString,代码也可能会因 OOM 而失败,只会花费更长的时间。