将 Doc2Vec 句子组合成段落向量

Combining Doc2Vec sentences into paragraph vectors

在 Gensim 的 Doc2Vec 中,如何将句子向量合并为一个段落的单个向量?我知道你可以训练整个段落,但显然训练单个句子、上下文等会更好。(我认为...?)

任何建议或正常用例?

此外,我如何从模型中检索 sentence/paragraph 向量?

Doc2Vec 的体系结构本身不涉及任何解析,并且train/test 对整个段落有意义。

在原始 paper 中,作者展示了仅将整个段落视为一个句子的结果,优于现有技术。