从 List<CompletableFuture> 转换为 CompletableFuture<List>

Convert from List<CompletableFuture> to CompletableFuture<List>

我正在尝试将 List<CompletableFuture<X>> 转换为 CompletableFuture<List<T>>。当您有许多异步任务并且需要获取所有这些任务的结果时,这非常有用。

如果其中任何一个失败,那么最终的未来就会失败。这就是我的实施方式:

public static <T> CompletableFuture<List<T>> sequence2(List<CompletableFuture<T>> com, ExecutorService exec) {
    if(com.isEmpty()){
        throw new IllegalArgumentException();
    }
    Stream<? extends CompletableFuture<T>> stream = com.stream();
    CompletableFuture<List<T>> init = CompletableFuture.completedFuture(new ArrayList<T>());
    return stream.reduce(init, (ls, fut) -> ls.thenComposeAsync(x -> fut.thenApplyAsync(y -> {
        x.add(y);
        return x;
    },exec),exec), (a, b) -> a.thenCombineAsync(b,(ls1,ls2)-> {
        ls1.addAll(ls2);
        return ls1;
    },exec));
}

给运行吧:

ExecutorService executorService = Executors.newCachedThreadPool();
Stream<CompletableFuture<Integer>> que = IntStream.range(0,100000).boxed().map(x -> CompletableFuture.supplyAsync(() -> {
    try {
        Thread.sleep((long) (Math.random() * 10));
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    return x;
}, executorService));
CompletableFuture<List<Integer>> sequence = sequence2(que.collect(Collectors.toList()), executorService);

如果其中任何一个失败,那么它就失败了。即使有一百万个期货,它也会按预期提供输出。我遇到的问题是:如果有超过 5000 个期货并且其中任何一个失败,我会得到 WhosebugError:

Exception in thread "pool-1-thread-2611" java.lang.WhosebugError at java.util.concurrent.CompletableFuture.internalComplete(CompletableFuture.java:210) at java.util.concurrent.CompletableFuture$ThenCompose.run(CompletableFuture.java:1487) at java.util.concurrent.CompletableFuture.postComplete(CompletableFuture.java:193) at java.util.concurrent.CompletableFuture.internalComplete(CompletableFuture.java:210) at java.util.concurrent.CompletableFuture$ThenCompose.run(CompletableFuture.java:1487)

我做错了什么?

注意:当任何一个future失败时,上面返回的future都会失败。接受的答案也应该考虑到这一点。

使用CompletableFuture.allOf(...):

static<T> CompletableFuture<List<T>> sequence(List<CompletableFuture<T>> com) {
    return CompletableFuture.allOf(com.toArray(new CompletableFuture<?>[0]))
            .thenApply(v -> com.stream()
                .map(CompletableFuture::join)
                .collect(Collectors.toList())
            );
}

关于您的实施的几点评论:

您对 .thenComposeAsync.thenApplyAsync.thenCombineAsync 的使用可能没有达到您的预期。这些 ...Async 方法 运行 在单独的线程中提供给它们的功能。因此,在您的情况下,您导致将新项目添加到列表中 运行 在提供的执行程序中。无需将轻量级操作塞入缓存的线程执行器中。不要在没有充分理由的情况下使用 thenXXXXAsync 方法。

此外,reduce 不应用于累积到可变容器中。即使流是顺序的时它可能会正常工作,但如果流是并行的,它就会失败。要执行可变缩减,请改用 .collect

如果您想在第一次失败后立即异常地完成整个计算,请在您的 sequence 方法中执行以下操作:

CompletableFuture<List<T>> result = CompletableFuture.allOf(com.toArray(new CompletableFuture<?>[0]))
        .thenApply(v -> com.stream()
                .map(CompletableFuture::join)
                .collect(Collectors.toList())
        );

com.forEach(f -> f.whenComplete((t, ex) -> {
    if (ex != null) {
        result.completeExceptionally(ex);
    }
}));

return result;

此外,如果您想在第一次失败时取消其余操作,请在 result.completeExceptionally(ex); 之后添加 exec.shutdownNow();。当然,这假设 exec 只存在于这一次计算中。如果没有,您将不得不循环并分别取消每个剩余的 Future

作为 ,您过度使用了 …Async 操作。此外,您正在编写一个复杂的操作链,对不反映您的程序逻辑的依赖项进行建模:

  • 你创建了一个工作 x,它取决于你列表中的第一个和第二个工作
  • 你创建了一个工作 x+1,它依赖于工作 x 和你列表中的第三个工作
  • 你创建了一个工作 x+2,它依赖于工作 x+1 和你列表中的第 4 个工作
  • 您创建了一个工作 x+5000,这取决于工作 x+4999 和您列表中的最后一个工作

然后,取消(明确地或由于异常)这个递归组合的作业可能会递归地执行并且可能会失败并返回 WhosebugError。这取决于实现。

As , there is a method, allOf 允许您模拟您的初衷,定义一项工作,该工作取决于您列表中的所有工作。

然而,值得注意的是,即使那样也没有必要。由于您使用的是无界线程池执行程序,因此您可以简单地 post 一个异步作业,将结果收集到一个列表中,然后就完成了。等待完成是暗示无论如何都要询问每个作业的结果。

ExecutorService executorService = Executors.newCachedThreadPool();
List<CompletableFuture<Integer>> que = IntStream.range(0, 100000)
  .mapToObj(x -> CompletableFuture.supplyAsync(() -> {
    LockSupport.parkNanos(TimeUnit.MILLISECONDS.toNanos((long)(Math.random()*10)));
    return x;
}, executorService)).collect(Collectors.toList());
CompletableFuture<List<Integer>> sequence = CompletableFuture.supplyAsync(
    () -> que.stream().map(CompletableFuture::join).collect(Collectors.toList()),
    executorService);

当线程数量有限且作业可能会产生额外的异步作业时,使用组合相关操作的方法很重要,以避免等待作业从必须首先完成的作业中窃取线程,但情况并非如此这里。

在这种特定情况下,一个作业简单地迭代大量先决条件作业并在必要时等待可能比对大量依赖项建模并让每个作业通知相关作业完成更有效。

在 CompletableFuture 上使用 thenCombine 的示例序列操作

public<T> CompletableFuture<List<T>> sequence(List<CompletableFuture<T>> com){

    CompletableFuture<List<T>> identity = CompletableFuture.completedFuture(new ArrayList<T>());

    BiFunction<CompletableFuture<List<T>>,CompletableFuture<T>,CompletableFuture<List<T>>> combineToList = 
            (acc,next) -> acc.thenCombine(next,(a,b) -> { a.add(b); return a;});

    BinaryOperator<CompletableFuture<List<T>>> combineLists = (a,b)-> a.thenCombine(b,(l1,l2)-> { l1.addAll(l2); return l1;}) ;  

    return com.stream()
              .reduce(identity,
                      combineToList,
                      combineLists);  

   }
} 

如果您不介意使用第三方库 cyclops-react(我是作者)有一组用于 CompletableFutures(以及 Optionals、Streams 等)的实用方法

  List<CompletableFuture<String>> listOfFutures;

  CompletableFuture<ListX<String>> sequence =CompletableFutures.sequence(listOfFutures);

您可以获得 Spotify 的 CompletableFutures 库并使用 allAsList method. I think it's inspired from Guava's Futures.allAsList 方法。

public static <T> CompletableFuture<List<T>> allAsList(
    List<? extends CompletionStage<? extends T>> stages) {

如果您不想使用库,这里有一个简单的实现:

public <T> CompletableFuture<List<T>> allAsList(final List<CompletableFuture<T>> futures) {
    return CompletableFuture.allOf(
        futures.toArray(new CompletableFuture[futures.size()])
    ).thenApply(ignored ->
        futures.stream().map(CompletableFuture::join).collect(Collectors.toList())
    );
}

除了 Spotify Futures 库之外,您还可以尝试我的代码位于此处:https://github.com/vsilaev/java-async-await/blob/master/net.tascalate.async.examples/src/main/java/net/tascalate/concurrent/CompletionStages.java(对同一包中的其他 classes 具有依赖性)

它实现了 return "at least N out of M" CompletionStage-s 的逻辑,其中包含允许容忍多少错误的策略。 all/any 案例有方便的方法,还有剩余期货的取消政策,加上代码处理 CompletionStage-s(接口)而不是 CompletableFuture(具体 class)。

Javaslang has a very convenient Future API。它还允许从未来集合中创建未来集合。

List<Future<String>> listOfFutures = ... 
Future<Seq<String>> futureOfList = Future.sequence(listOfFutures);

http://static.javadoc.io/io.javaslang/javaslang/2.0.5/javaslang/concurrent/Future.html#sequence-java.lang.Iterable-

添加@Misha 接受的答案,它可以进一步扩展为收集器:

 public static <T> Collector<CompletableFuture<T>, ?, CompletableFuture<List<T>>> sequenceCollector() {
    return Collectors.collectingAndThen(Collectors.toList(), com -> sequence(com));
}

现在您可以:

Stream<CompletableFuture<Integer>> stream = Stream.of(
    CompletableFuture.completedFuture(1),
    CompletableFuture.completedFuture(2),
    CompletableFuture.completedFuture(3)
);
CompletableFuture<List<Integer>> ans = stream.collect(sequenceCollector());

免责声明:这不会完全回答最初的问题。它将缺少 "fail all if one fails" 部分。但是,我无法回答实际的、更通用的问题,因为它作为这个问题的副本被关闭:Java 8 CompletableFuture.allOf(...) with Collection or List。所以我会在这里回答:

How to convert List<CompletableFuture<V>> to CompletableFuture<List<V>> using Java 8's stream API?

总结: 使用如下:

private <V> CompletableFuture<List<V>> sequence(List<CompletableFuture<V>> listOfFutures) {
    CompletableFuture<List<V>> identity = CompletableFuture.completedFuture(new ArrayList<>());

    BiFunction<CompletableFuture<List<V>>, CompletableFuture<V>, CompletableFuture<List<V>>> accumulator = (futureList, futureValue) ->
        futureValue.thenCombine(futureList, (value, list) -> {
                List<V> newList = new ArrayList<>(list.size() + 1);
                newList.addAll(list);
                newList.add(value);
                return newList;
            });

    BinaryOperator<CompletableFuture<List<V>>> combiner = (futureList1, futureList2) -> futureList1.thenCombine(futureList2, (list1, list2) -> {
        List<V> newList = new ArrayList<>(list1.size() + list2.size());
        newList.addAll(list1);
        newList.addAll(list2);
        return newList;
    });

    return listOfFutures.stream().reduce(identity, accumulator, combiner);
}

用法示例:

List<CompletableFuture<String>> listOfFutures = IntStream.range(0, numThreads)
    .mapToObj(i -> loadData(i, executor)).collect(toList());

CompletableFuture<List<String>> futureList = sequence(listOfFutures);

完整示例:

import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.CompletableFuture;
import java.util.concurrent.Executor;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.ThreadLocalRandom;
import java.util.function.BiFunction;
import java.util.function.BinaryOperator;
import java.util.stream.IntStream;

import static java.util.stream.Collectors.toList;

public class ListOfFuturesToFutureOfList {

    public static void main(String[] args) {
        ListOfFuturesToFutureOfList test = new ListOfFuturesToFutureOfList();
        test.load(10);
    }

    public void load(int numThreads) {
        final ExecutorService executor = Executors.newFixedThreadPool(numThreads);

        List<CompletableFuture<String>> listOfFutures = IntStream.range(0, numThreads)
            .mapToObj(i -> loadData(i, executor)).collect(toList());

        CompletableFuture<List<String>> futureList = sequence(listOfFutures);

        System.out.println("Future complete before blocking? " + futureList.isDone());

        // this will block until all futures are completed
        List<String> data = futureList.join();
        System.out.println("Loaded data: " + data);

        System.out.println("Future complete after blocking? " + futureList.isDone());

        executor.shutdown();
    }

    public CompletableFuture<String> loadData(int dataPoint, Executor executor) {
        return CompletableFuture.supplyAsync(() -> {
            ThreadLocalRandom rnd = ThreadLocalRandom.current();

            System.out.println("Starting to load test data " + dataPoint);

            try {
                Thread.sleep(500 + rnd.nextInt(1500));
            } catch (InterruptedException e) {
                e.printStackTrace();
            }

            System.out.println("Successfully loaded test data " + dataPoint);

            return "data " + dataPoint;
        }, executor);
    }

    private <V> CompletableFuture<List<V>> sequence(List<CompletableFuture<V>> listOfFutures) {
        CompletableFuture<List<V>> identity = CompletableFuture.completedFuture(new ArrayList<>());

        BiFunction<CompletableFuture<List<V>>, CompletableFuture<V>, CompletableFuture<List<V>>> accumulator = (futureList, futureValue) ->
            futureValue.thenCombine(futureList, (value, list) -> {
                    List<V> newList = new ArrayList<>(list.size() + 1);
                    newList.addAll(list);
                    newList.add(value);
                    return newList;
                });

        BinaryOperator<CompletableFuture<List<V>>> combiner = (futureList1, futureList2) -> futureList1.thenCombine(futureList2, (list1, list2) -> {
            List<V> newList = new ArrayList<>(list1.size() + list2.size());
            newList.addAll(list1);
            newList.addAll(list2);
            return newList;
        });

        return listOfFutures.stream().reduce(identity, accumulator, combiner);
    }

}

您的任务可以像下面这样轻松完成,

final List<CompletableFuture<Module> futures =...
CompletableFuture.allOf(futures.stream().toArray(CompletableFuture[]::new)).join();