从 Vespa 大规模检索文档

Retrieving documents from Vespa at scale

我正在寻找关于需要什么以及如何连接 Vespa 以大规模检索索引数据的概述。 我已经 运行 对 Vespa 文档进行了压力测试 RESTful API 并且按照文档中的建议,它有一个上限。

http://docs.vespa.ai/documentation/document-api-guide.html 指明了前进的方向,但假定在主题方面处于领先地位。

我会算

com.yahoo.documentapi.messagebus.MessageBusDocumentAccess

以及相关的总线创建等

MessageBusDocumentApiTestCase

加深理解。

package jrt https://github.com/vespa-engine/vespa/tree/master/jrt 和一些更多的资源来提供帮助,但是要谦虚地接受,很难把它们放在一起 :)

问题是,如果有记录,我找不到任何指南来清楚地解释如何从外部系统调用 vespa,或者如果那不可能,运行 一个嵌入式客户端以及它如何与vespa 集群。

如果存在这样的概述,请指出我。

编辑:

vespaclient-java/src/main/java/com/yahoo/vespaget/DocumentRetriever.java

-- 另一个例子。想法?

这似乎是一个已在 github 问题中得到回答的问题的重复:https://github.com/vespa-engine/vespa/issues/3628

For feeding to Vespa clusters from external systems which is not part of your Vespa cluster we recommend http://docs.vespa.ai/documentation/vespa-http-client.html.

For reading single get operations from Vespa the http RESTful API for GET described in http://docs.vespa.ai/documentation/document-api.html is the best option. The RESTful API for GET is built on top of the http://docs.vespa.ai/documentation/document-api-guide.html which is a low-level api to use on nodes which are part of a Vespa cluster already and have access to configuration like schema and content clusters and number of nodes.