将 tsvectors 与自定义位置偏移量连接起来

Concatenate tsvectors with a custom position offset

tsvector 连接运算符 (tsvector || tsvector),如 the official documentation states,结合了给定向量的词位和位置信息。具体来说:

Positions appearing in the right-hand vector are offset by the largest position mentioned in the left-hand vector

所以这个:

select 'one:10'::tsvector || 'two:5'::tsvector;

给予

'one':10 'two':15

但是如果我需要在连接的短语之间有更大的偏移怎么办?比方说,100。那就是:

'one':10 'two':115

我怎样才能做到这一点?

一种方法是创建一个辅助函数来偏移向量位置。通过在具有占位符词位和等于所需偏移量的硬编码位置的向量上使用相同的连接运算符,然后从生成的向量中删除占位符词位,可以轻松实现它。

CREATE FUNCTION tsvector_offset(tsvector, int) RETURNS tsvector
    AS $$select ts_delete(('$#%FAKE_LEXEM%#$:' || )::tsvector || , '$#%FAKE_LEXEM%#$');$$
    LANGUAGE SQL
    IMMUTABLE
    RETURNS NULL ON NULL INPUT;

现在你可以这样使用了:

select 'one:10'::tsvector || tsvector_offset('two:5'::tsvector, 100);

并得到想要的结果:

'one':10 'two':115