如何使用斯坦福大学的 CoreNlp 进行词嵌入?

How do I get word embedding using CoreNlp from Stanford?

我正在使用 CoreNlp 从大文本中提取信息。然而,它使用 "triple" 方法,其中单个句子产生许多输出,这很好,但有些句子没有意义。我试图通过 运行 另一个无监督 NLP 来消除它,并尝试利用 CoreNlp 中的函数,但我坚持从 CoreNlp 获取词向量。谁能指出我需要从哪里开始搜索在 CoreNlp 中嵌入单词的代码?我也是 java 和 IT 的新手。

有一些开放库,如 glove、word2vec、text2vec,但我注意到 glove 已经在 CoreNlp 中使用(如果错误请纠正我)。

由于从头开始训练您自己的模型可能是一项耗时的任务,您可以从以下位置下载预训练向量: https://nlp.stanford.edu/projects/glove/

然而,这里有一个 dl4j 的例子可能会骗人: https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/nlp/glove/GloVeExample.java