Vespa 搜索查询(在数组上)即使在从数组中删除元素后也会给出命中
Vespa search query (on array) gives hits even after removing the element from array
我正在查询 vespa 以检查用户 ID 数组中是否存在特定的用户 ID。
http://localhost:8080/search/?yql=select * from sources doc where userIds contains 'user1';
搜索定义:
search doc {
document doc {
field userIds type array<string> {
indexing : index | summary
}
field doctype type string {
indexing : summary
}
}
响应示例:
{
"children": [{
"id": "id:doc:doc::0",
"fields": {
"userIds": ["user1", "user2", "user3"],
"doctype": "type1"
}
},
{
"id": "id:doc:doc::1",
"fields": {
"userIds": ["user1", "user3"],
"doctype": "type2"
}
}
]}
当我从数组中删除一个元素 ("user1") 时,即使它被 成功删除,我仍然会得到响应响应 来自数组。
更新API:
PUT http://localhost:8080/document/v1/doc/doc/docid/0
{
"update": "id:doc:doc::0",
"fields": {
"userIds[0]": {
"remove": 0
}
}
}
GET http://localhost:8080/document/v1/doc/doc/docid/0
{"fields": {
"userIds": ["user2", "user3"],
"doctype": "type1"
}
}
即使更新了上面的 userIds 字段之后,同样的查询
http://localhost:8080/search/?yql=select * from sources doc where userIds contains 'user1';
给出回应,
{"children": [{
"id": "id:doc:doc::0",
"fields": {
"userIds": ["user2", "user3"],
"doctype": "type1"
}
},
{
"id": "id:doc:doc::1",
"fields": {
"userIds": ["user1", "user3"],
"doctype": "type2"
}
}]}
在上面的响应中,"id:doc:doc::0的userIds数组中没有"user1" ”。但是,查询仍然将其作为命中。
请帮忙。
Edit-1:请注意,当我分配一个删除了元素的新数组时,它可以正常工作
PUT http://localhost:8080/document/v1/doc/doc/docid/0
{
"update": "id:doc:doc::0",
"fields": {
"userIds": {
"assign": ["user2", "user3"]
}
}
}
上述更新 API 为查询提供了预期的响应响应。但是,当我从 Searcher 中调用 Update API 时,我遇到了巨大的响应时间滞后。 (创建一个新的数组对象并分配给userIds字段,随着数组增长到大约50000的大尺寸)
请告诉我为什么 remove 选项失败。我真的需要通过使用它来提高查询性能。
Edit-2:以下语法,提及要删除以更新数组的元素,可以正常工作。感谢@Jo 的评论。
PUT http://localhost:8080/document/v1/doc/doc/docid/0
{
"update": "id:doc:doc::0",
"fields": {
"userIds": {
"remove": ["user1"]
}
}
}
请注意,以上语法删除了所有出现的指定元素。
(以上讨论总结提供答案备案)
不支持按索引删除数组元素,请改用按值删除:
{
"update": "id:doc:doc::0",
"fields": {
"userIds": {
"remove": ["user1"]
}
}
}
我正在查询 vespa 以检查用户 ID 数组中是否存在特定的用户 ID。
http://localhost:8080/search/?yql=select * from sources doc where userIds contains 'user1';
搜索定义:
search doc {
document doc {
field userIds type array<string> {
indexing : index | summary
}
field doctype type string {
indexing : summary
}
}
响应示例:
{
"children": [{
"id": "id:doc:doc::0",
"fields": {
"userIds": ["user1", "user2", "user3"],
"doctype": "type1"
}
},
{
"id": "id:doc:doc::1",
"fields": {
"userIds": ["user1", "user3"],
"doctype": "type2"
}
}
]}
当我从数组中删除一个元素 ("user1") 时,即使它被 成功删除,我仍然会得到响应响应 来自数组。
更新API:
PUT http://localhost:8080/document/v1/doc/doc/docid/0
{
"update": "id:doc:doc::0",
"fields": {
"userIds[0]": {
"remove": 0
}
}
}
GET http://localhost:8080/document/v1/doc/doc/docid/0
{"fields": {
"userIds": ["user2", "user3"],
"doctype": "type1"
}
}
即使更新了上面的 userIds 字段之后,同样的查询
http://localhost:8080/search/?yql=select * from sources doc where userIds contains 'user1';
给出回应,
{"children": [{
"id": "id:doc:doc::0",
"fields": {
"userIds": ["user2", "user3"],
"doctype": "type1"
}
},
{
"id": "id:doc:doc::1",
"fields": {
"userIds": ["user1", "user3"],
"doctype": "type2"
}
}]}
在上面的响应中,"id:doc:doc::0的userIds数组中没有"user1" ”。但是,查询仍然将其作为命中。 请帮忙。
Edit-1:请注意,当我分配一个删除了元素的新数组时,它可以正常工作
PUT http://localhost:8080/document/v1/doc/doc/docid/0
{
"update": "id:doc:doc::0",
"fields": {
"userIds": {
"assign": ["user2", "user3"]
}
}
}
上述更新 API 为查询提供了预期的响应响应。但是,当我从 Searcher 中调用 Update API 时,我遇到了巨大的响应时间滞后。 (创建一个新的数组对象并分配给userIds字段,随着数组增长到大约50000的大尺寸)
请告诉我为什么 remove 选项失败。我真的需要通过使用它来提高查询性能。
Edit-2:以下语法,提及要删除以更新数组的元素,可以正常工作。感谢@Jo 的评论。
PUT http://localhost:8080/document/v1/doc/doc/docid/0
{
"update": "id:doc:doc::0",
"fields": {
"userIds": {
"remove": ["user1"]
}
}
}
请注意,以上语法删除了所有出现的指定元素。
(以上讨论总结提供答案备案)
不支持按索引删除数组元素,请改用按值删除:
{
"update": "id:doc:doc::0",
"fields": {
"userIds": {
"remove": ["user1"]
}
}
}