Scala / Java word2vec reader
Scala / Java word2vec reader
我有几个具有以下标准布局的 word2vec 文本文件:
numWords vecSize
word1 vec1 vec2 ...
word2 vec1 vec2 ...
...
是否有任何 Scala 或 Java 库可以读取这些内容并计算简单的东西,例如:
- isWordInVocab
- getWordVectors
- 最近的邻居
- 余弦距离
- ...
我能找到一些仅适用于二进制格式的文件,有没有办法使用这些文件(除了我自己编写的)?
我刚刚结束了编写自己的 class 以避免整个 dl4j/nd4j import/setup/run 过程。
我有几个具有以下标准布局的 word2vec 文本文件:
numWords vecSize
word1 vec1 vec2 ...
word2 vec1 vec2 ...
...
是否有任何 Scala 或 Java 库可以读取这些内容并计算简单的东西,例如:
- isWordInVocab
- getWordVectors
- 最近的邻居
- 余弦距离
- ...
我能找到一些仅适用于二进制格式的文件,有没有办法使用这些文件(除了我自己编写的)?
我刚刚结束了编写自己的 class 以避免整个 dl4j/nd4j import/setup/run 过程。