询问 Deeplearning4j 库中 Word2Vec 中词汇的 "default" 大小

Ask About The "default" Size of Vocabulary in Word2Vec in Deeplearning4j Library

我目前正在学习这个库:来自 Deeplearning4j 的 Word2Vec (Homepage, Github)

以下是该方法的使用示例:

//build Word2Vec model
Word2Vec vec = new Word2Vec.Builder()
                .layerSize(100)
                .windowSize(5)
                .stopWords(stopList)
                .tokenizerFactory(t)
                .learningRate(0.025)
                .build();

我知道我可以用这个方法限制词汇量:

vec.limitVocabularySize(100) //limit the vocab size as 100

上面的示例是我想将词汇量限制为 100 的命令

我的问题:
谁能告诉我词汇的默认大小是多少(即,如果我不设置限制)?

最佳,

默认情况下没有限制。这意味着它将把它找到的所有单词添加到词汇表中。

另请注意,您链接到的示例已有 4 年以上的历史。我建议你使用官方例子:https://github.com/eclipse/deeplearning4j-examples