无法使 ArangoSearch 视图在 ArangoDB 中正常工作

Question

我在使用 ArangoSearch 时遇到问题。

这是我在名为 things 的集合中的一些虚拟数据（为简单起见，我删除了它们的每个“_id”、“_key”和“_rev”属性）：

{"text":"eat a cookie"}
 
{"text":"I like cookies"}
 
{"text":"Timmy how are u"}
 
{"text":"I read a book on elves"}

我有一个看起来像这样的视图（我称之为 practice）：

{
  "writebufferIdle": 64,
  "type": "arangosearch",
  "primarySortCompression": "lz4",
  "links": {
    "things": {
      "analyzers": [
        "text_en",
        "identity"
      ],
      "fields": {
        "text": {
          "analyzers": [
            "text_en"
          ]
        }
      },
      "includeAllFields": true,
      "storeValues": "none",
      "trackListPositions": false
    }
  },
  "primarySort": [],
  "writebufferSizeMax": 33554432,
  "consolidationPolicy": {
    "type": "tier",
    "segmentsBytesFloor": 2097152,
    "segmentsBytesMax": 5368709120,
    "segmentsMax": 10,
    "segmentsMin": 1,
    "minScore": 0
  },
  "cleanupIntervalStep": 2,
  "commitIntervalMsec": 1000,
  "storedValues": [],
  "id": "138993",
  "globallyUniqueId": "h23A40B2F96C2/138993",
  "writebufferActive": 0,
  "consolidationIntervalMsec": 1000
}

当我进行如下 AQL 搜索时，它正确 returns 4:

FOR docs IN practice COLLECT WITH COUNT INTO num RETURN num

但是当我像这样进行 AQL 搜索时，我得到的大多是空数组：

FOR doc IN practice
SEARCH ANALYZER(doc.text == "cookie", "text_en")
RETURN doc

（奇怪的是，有一两个词适用于上述内容，但大多数不适用 - 例如，“cookie”returns 是一个空数组，但“how”returns 是一个匹配）

知道我做错了什么吗？

谢谢

Answer 1

已编入索引的 text 字段已应用 text_en 处理，但您并未将其应用于搜索词。

ANALYZER(doc.text == "cookie", "text_en")

ANALYZER()函数这里只选择索引数据的分析器

根据分析器如何转换存储的属性值，由于词干提取可能会出现不匹配。所有内置的文本分析器都启用了词干提取。

尝试 RETURN TOKENS("cookie", "text_en") 看看分析器对单词做了什么。

这应该找到两个东西：

ANALYZER(doc.text == TOKENS("cookie", "text_en")[0], "text_en")

无法使 ArangoSearch 视图在 ArangoDB 中正常工作

Unable to get an ArangoSearch view working properly in ArangoDB

graph-databases

arangodb

aql

python-arango