为什么消费者会降低生产者的绩效

Why do consumers decrease the producer's performance

我目前正在尝试通过实施生产者-消费者模式来提高我的软件的性能。在我的特定情况下,我有一个按顺序创建行的生产者和多个对给定批次的行执行某些任务的消费者。

我现在面临的问题是,当我测量我的生产者-消费者模式的性能时,我可以看到生产者的 运行ning 时间大量增加,我不明白这是为什么案.

到目前为止,我主要分析了我的代码并进行了微基准测试,但结果并没有让我找到实际问题。

public class ProdCons {

    static class Row {
        String[] _cols;

        Row() {
            _cols = Stream.generate(() -> "Row-Entry").limit(5).toArray(String[]::new);
        }
    }

    static class Producer {

        private static final int N_ITER = 8000000;

        final ExecutorService _execService;

        final int _batchSize;

        final Function<Row[], Consumer> _f;

        Producer(final int batchSize, final int nThreads, Function<Row[], Consumer> f) throws InterruptedException {
            _execService = Executors.newFixedThreadPool(nThreads);
            _batchSize = batchSize;
            _f = f;
            // init all threads to exclude their generaration time
            startThreads();
        }

        private void startThreads() throws InterruptedException {
            List<Callable<Void>> l = Stream.generate(() -> new Callable<Void>() {

                @Override
                public Void call() throws Exception {
                    Thread.sleep(10);
                    return null;
                }

            }).limit(4).collect(Collectors.toList());
            _execService.invokeAll(l);
        }

        long run() throws InterruptedException {
            final long start = System.nanoTime();
            int idx = 0;
            Row[] batch = new Row[_batchSize];
            for (int i = 0; i < N_ITER; i++) {
                batch[idx++] = new Row();
                if (idx == _batchSize) {
                    _execService.submit(_f.apply(batch));
                    batch = new Row[_batchSize];
                    idx = 0;
                }
            }
            final long time = System.nanoTime() - start;
            _execService.shutdownNow();
            _execService.awaitTermination(100, TimeUnit.MILLISECONDS);
            return time;
        }
    }

    static abstract class Consumer implements Callable<String> {

        final Row[] _rowBatch;

        Consumer(final Row[] data) {
            _rowBatch = data;
        }

    }

    static class NoOpConsumer extends Consumer {

        NoOpConsumer(Row[] data) {
            super(data);
        }

        @Override
        public String call() throws Exception {
            return null;
        }
    }

    static class SomeConsumer extends Consumer {

        SomeConsumer(Row[] data) {
            super(data);
        }

        @Override
        public String call() throws Exception {
            String res = null;
            for (int i = 0; i < 1000; i++) {
                res = "";
                for (final Row r : _rowBatch) {
                    for (final String s : r._cols) {
                        res += s;
                    }
                }
            }

            return res;
        }

    }

    public static void main(String[] args) throws InterruptedException {
        final int nRuns = 10;
        long totTime = 0;
        for (int i = 0; i < nRuns; i++) {
            totTime += new Producer(100, 1, (data) -> new NoOpConsumer(data)).run();
        }
        System.out.println("Avg time with NoOpConsumer:\t" + (totTime / 1000000000d) / nRuns + "s");

        totTime = 0;
        for (int i = 0; i < nRuns; i++) {
            totTime += new Producer(100, 1, (data) -> new SomeConsumer(data)).run();
        }
        System.out.println("Avg time with SomeConsumer:\t" + (totTime / 1000000000d) / nRuns + "s");
    }

实际上,由于消费者 运行 与生产者在不同的线程中,我希望生产者的 运行 宁时间不受消费者工作量的影响。然而,运行我得到以下输出的程序

#1 个线程,#1​​00 批量大小

NoOpConsumer 的平均时间:0.7507254368s

与 SomeConsumer 的平均时间:1.5334749871s

请注意,时间测量仅测量生产时间而不测量消费者时间,并且不提交任何作业需要平均。 ~0.6 秒

更令人惊讶的是,当我将线程数从 1 增加到 4 时,我得到以下结果(4 核超线程)。

#4 个线程,#1​​00 批量大小

NoOpConsumer 的平均时间:0.7741189636s

与 SomeConsumer 的平均时间:2.5561667638s

我是不是做错了什么?我错过了什么?目前我不得不相信 运行ning 时间差异是由于上下文切换或与我的系统相关的任何事情造成的。

线程之间并没有完全隔离。

看起来您的 SomeConsumer class 分配了大量内存,这会产生垃圾收集工作,该工作在所有线程(包括您的生产者线程)之间共享。

它还会访问大量内存,这可能会将生产者使用的内存从 L1 或 L2 缓存中剔除。访问实际内存比访问缓存需要更长的时间,因此这也会使您的生产者花费更长的时间。

另请注意,我实际上并没有验证您是否正确测量了生产者时间,这很容易出错。