word2vec模型是否也可以用于单词而不是句子作为训练数据
Can word2vec model be used for words also as training data instead of sentences
在Word2vec中我们可以用单词代替句子来训练模型吗
像下面的代码gberg_sents是句子标记
model = Word2Vec(sentences=gberg_sents,size=64,sg=1,window=10,min_count=5,seed=42,workers=8)
像这样我们也可以使用单词标记
不,word2vec 是用语言模型训练的 objective,也就是说,它预测其他单词周围出现的单词。为此,您的训练数据需要是真实的句子,以显示单词在上下文中的使用方式。实际上是单词的上下文为您提供了在嵌入中捕获的信息。
在Word2vec中我们可以用单词代替句子来训练模型吗
像下面的代码gberg_sents是句子标记 model = Word2Vec(sentences=gberg_sents,size=64,sg=1,window=10,min_count=5,seed=42,workers=8)
像这样我们也可以使用单词标记
不,word2vec 是用语言模型训练的 objective,也就是说,它预测其他单词周围出现的单词。为此,您的训练数据需要是真实的句子,以显示单词在上下文中的使用方式。实际上是单词的上下文为您提供了在嵌入中捕获的信息。