反应式 WebClient 不发出响应

Reactive WebClient not emitting a response

我有一个关于 Spring Reactive WebClient 的问题... 几天前,我决定使用 Spring Framework 中的新反应式内容,并且我制作了一个小项目,仅出于个人目的抓取数据。 (向一个网页发出多个请求并合并结果)。

我开始使用新的响应式 WebClient 来发出请求,但我发现的问题是客户端没有为每个请求发出响应。听起来很奇怪。这是我为获取数据所做的:

private Mono<String> fetchData(String uri) {
    return this.client
            .get()
            .uri(uri)
            .header("X-Fsign","SW9D1eZo")
            .retrieve()
            .bodyToMono(String.class)
            .timeout(Duration.ofSeconds(35))
            .log("category", Level.ALL, SignalType.ON_ERROR, SignalType.ON_COMPLETE, SignalType.CANCEL, SignalType.REQUEST);
}

以及调用fetchData的函数:

public Mono<List<Stat>> fetch() {
    return fetchData(URL)
            .map(this::extractUrls)
            .doOnNext(System.out::println)
            .doOnNext(s-> System.out.println("all ids are "+s.size()))
            .flatMapIterable(q->q)
            .map(s -> s.substring(7, 15))
            .map(s -> "http://d.flashscore.com/x/feed/d_hh_" + s + "_en_1") // list of N-length urls
            .flatMap(this::fetchData)
            .map(this::extractHeadToHead)
            .collectList();
}

和订阅者:

    FlashScoreService bean = ctx.getBean(FlashScoreService.class);
    bean.fetch().subscribe(s->{
        System.out.println("finished !!! " + s.size()); //expecting same N-length list size
    },Throwable::printStackTrace);

问题是如果我提出的请求多一点 > 100。 我没有得到所有响应,没有抛出错误或返回错误响应代码,并且调用订阅方法的大小与请求数不同。

我发出的请求基于字符串列表 (url),在发出所有响应后,我应该将所有响应都作为列表接收,因为我正在使用 collectList()。当我执行 100 个请求时,我希望收到 100 个响应的列表,但实际上我有时会收到 100 个,有时会收到 96 个等等……可能是某些事情悄无声息地失败了。 这很容易重现这里是我的 github 项目 link.

示例输出:

all ids are 176
finished !!! 171

请给我建议如何调试或我做错了什么。感谢帮助。

更新:

日志显示如果我传递 126 个 url 例如:

onNext(ReactorClientHttpResponse{request=[GET/some_url],status=200}) is called 121 times. May be here is the problem.
onComplete() is called 126 times which is the exact same length of the passed list of urls

但是如何在不调用 onNext() 或 onError( ) 的情况下完成某些请求? (单声道成功和错误)

我认为问题不在 WebClient 中,而是在其他地方。环境或服务器阻止请求,但可能我应该收到一些错误日志。

ps。感谢您的帮助!

这是一个棘手的问题。调试收到的实际 HTTP 帧,似乎我们确实没有收到某些请求的响应。使用 Wireshark 进行更多调试,看起来远程服务器正在请求使用 FIN, ACK TCP 数据包结束连接并且客户端确认了它。问题是这个连接仍然从池中取出,在第一个 FIN, ACK TCP 数据包之后发送另一个 GET 请求。

也许远程服务器在处理大量请求后正在关闭连接;无论如何,这是完全合法的行为。请注意,我并没有始终如一地重现这一点。

解决方法

您可以在客户端禁用连接池;这会更慢并且显然不会触发此问题。为此,请使用以下内容:

this.client = WebClient.builder()
                .clientConnector(new ReactorClientHttpConnector(new Consumer<HttpClientOptions.Builder>() {
                    @Override
                    public void accept(HttpClientOptions.Builder builder) {
                        builder.disablePool();
                    }
                }))
                .build();

潜在问题

根本问题是 HTTP 客户端不应该 onComplete 在关闭 TCP 连接时不发送响应。或者更好的是,HTTP 客户端在关闭时不应重用连接。当我知道更多时,我会回来报告。