火花 word2vec window 大小

spark word2vec window size

是否可以更改 pyspark.mllib.feature.Word2Vec 中使用的 window 大小,或者永久固定为 5?这似乎是一个相当重要的功能。

我在这里没有看到这个选项: https://spark.apache.org/docs/1.4.1/api/scala/index.html#org.apache.spark.mllib.feature.Word2Vec

没错,查看 Word2Vec 代码我们可以看到它是一个私有 val。如果你愿意,你可以覆盖 Word2Vec 来更改 window 大小。我已经创建了一个 JIRA ( https://issues.apache.org/jira/browse/SPARK-10299 ) 以允许设置 window 大小,因为 1.5 已经在 RC 阶段,这可能要到 1.6 时间才能完成。