查看加载到 vespa 中的所有文件

Question

有什么方法可以获取加载到 vespa 中的所有文档吗？

我尝试使用正则表达式进行查询，但没有达到预期效果。

select * from entity where ID matches "[.]+";

ID 不是属性，但我尝试使用属性字段，两者都没有响应任何值。

Answer 1

要从 Vespa 转储所有文档，请使用 vespa-visit：

"visit" 是一个与搜索界面不同的界面 - 它是为高吞吐量的大数据传输而构建的，但不一定是低延迟

团队使用访问提取完整转储或子集，使用 selection expression

Answer 2

使用访问而不是搜索，使用 vespa-visit tool or using visiting in the document/v1 REST API 通常更适合转储文件。

如果您想使用搜索，请使用此查询来匹配某种类型的所有文档：

select * from yourdocumenttype where sddocname contains 'yourdocumenttype';

要以此遍历所有文档，使用文档中的某个字段将文档集划分为更小的块并一次查询一个块会更有效（例如，如果您有时间戳字段, 向查询添加范围条件以在每个查询中检索一段时间的文档）。

（正则表达式仅在流模式下支持。）

View all the documents loaded into vespa