如何使用 RxJava 串行批处理长进程?

How to batch long process in serial using RxJava?

我有一大串字符串需要根据远程 API 检查。

Observable.from(List<String> strings) // let's say the `strings` has > 5000 items
   .buffer(50) // splitting the strings into 50-sized chunks, it returns Observable<List<String>> (fast)
   .flatMap((strings) -> {
       // checkPhoneNumbers is a network call using Retrofit's RxJava (slow)
       return mSyncApi.checkPhoneNumbers(strings);
   })
   .reduce( ... ) // aggregate all checking results
   .subscribe( ... );

问题是 buffer() 似乎发出 List<String> 太快以至于所有多个 .checkPhoneNumbers() 几乎同时执行。 我想实现的是排队.checkPhoneNumbers()以更好地支持连接速度较慢的设备。

按预定义的时间间隔限制发出的 List<String> 没有意义,因为这对于具有闪电般快速连接的设备来说是不利的。 我在 flatMap() 之后尝试了 RxJava 的 serialize() 但它似乎没有任何区别(虽然我不知道它是否是 serialize 的正确使用)。

感谢任何替代方法!谢谢。

正如@zsxwing 所建议的,如果您试图限制 flatMap.

内部发生的并发,我认为 maxConcurrent 重载就是您要寻找的内容

例如:https://gist.github.com/benjchristensen/a0350776a595fd6e3810#file-parallelexecution-java-L78

private static void flatMapBufferedExampleAsync() {
    final AtomicInteger total = new AtomicInteger();
    Observable.range(0, 500000000)
            .doOnNext(i -> total.incrementAndGet())
            .buffer(100)
            .doOnNext(i -> System.out.println("emit " + i))
            .flatMap(i -> {
                return Observable.from(i).subscribeOn(Schedulers.computation()).map(item -> {
                    // simulate computational work
                        try {
                            Thread.sleep(10);
                        } catch (Exception e) {
                        }
                        return item + " processed " + Thread.currentThread();
                    });
            }, 2 /* limit concurrency to 2 */) // <--- note argument here
           .toBlocking().forEach(System.out::println);

    System.out.println("total emitted: " + total.get());
}