询问 Deeplearning4j 库中 Word2Vec 中词汇的 "default" 大小
Ask About The "default" Size of Vocabulary in Word2Vec in Deeplearning4j Library
我目前正在学习这个库:来自 Deeplearning4j 的 Word2Vec (Homepage, Github)
以下是该方法的使用示例:
//build Word2Vec model
Word2Vec vec = new Word2Vec.Builder()
.layerSize(100)
.windowSize(5)
.stopWords(stopList)
.tokenizerFactory(t)
.learningRate(0.025)
.build();
我知道我可以用这个方法限制词汇量:
vec.limitVocabularySize(100) //limit the vocab size as 100
上面的示例是我想将词汇量限制为 100 的命令
我的问题:
谁能告诉我词汇的默认大小是多少(即,如果我不设置限制)?
最佳,
默认情况下没有限制。这意味着它将把它找到的所有单词添加到词汇表中。
另请注意,您链接到的示例已有 4 年以上的历史。我建议你使用官方例子:https://github.com/eclipse/deeplearning4j-examples
我目前正在学习这个库:来自 Deeplearning4j 的 Word2Vec (Homepage, Github)
以下是该方法的使用示例:
//build Word2Vec model
Word2Vec vec = new Word2Vec.Builder()
.layerSize(100)
.windowSize(5)
.stopWords(stopList)
.tokenizerFactory(t)
.learningRate(0.025)
.build();
我知道我可以用这个方法限制词汇量:
vec.limitVocabularySize(100) //limit the vocab size as 100
上面的示例是我想将词汇量限制为 100 的命令
我的问题:
谁能告诉我词汇的默认大小是多少(即,如果我不设置限制)?
最佳,
默认情况下没有限制。这意味着它将把它找到的所有单词添加到词汇表中。
另请注意,您链接到的示例已有 4 年以上的历史。我建议你使用官方例子:https://github.com/eclipse/deeplearning4j-examples