使用 Start/End 修饰词搜索和单词形式问题
Using Start/End Modifier search with wordforms isue
如果我使用 "^Word$"
搜索带有名称字段的 table,它会找到它。
如果我有一个 Word1 Word2 > Word3
结构的 Wordform 例如
United States of America > USA
相同的查询将起作用。但是,如果我反向执行相同的字形,例如Word3 > Word1 Word2
:
USA > United States of America
然后是没有找到使用相同的 start/end 修饰符。然而,我的习惯是 Word1 > Word2 Word3
这样 Word 2 和 Word 3 仍然可以在搜索中找到,否则就不行了。
有没有办法设置 Start/End 修饰符搜索,以便它仍然可以找到 W1 > W2 W3
?
我唯一的建议是使用 regexp_filter
来进行扩展,而不是单词形式。
regexp_filter = \bUSA\b => United States of America
或类似的。好处是对大写有更多的控制(例如只做大写美国)
这意味着,扩展在标记化过程中发生得更早,这意味着它对扩展查询语法的影响较小。
理论上一个查询
"^Word$"
然后应该变成
"^United States of America$"
仍然有效:)
我认为单词形式不起作用,因为 America$
将作为关键字放入索引中。但是查询在一个词上同时查找 ^ 和 $。
如果我使用 "^Word$"
搜索带有名称字段的 table,它会找到它。
如果我有一个 Word1 Word2 > Word3
结构的 Wordform 例如
United States of America > USA
相同的查询将起作用。但是,如果我反向执行相同的字形,例如Word3 > Word1 Word2
:
USA > United States of America
然后是没有找到使用相同的 start/end 修饰符。然而,我的习惯是 Word1 > Word2 Word3
这样 Word 2 和 Word 3 仍然可以在搜索中找到,否则就不行了。
有没有办法设置 Start/End 修饰符搜索,以便它仍然可以找到 W1 > W2 W3
?
我唯一的建议是使用 regexp_filter
来进行扩展,而不是单词形式。
regexp_filter = \bUSA\b => United States of America
或类似的。好处是对大写有更多的控制(例如只做大写美国)
这意味着,扩展在标记化过程中发生得更早,这意味着它对扩展查询语法的影响较小。
理论上一个查询
"^Word$"
然后应该变成
"^United States of America$"
仍然有效:)
我认为单词形式不起作用,因为 America$
将作为关键字放入索引中。但是查询在一个词上同时查找 ^ 和 $。