向 Apache mahout 添加新方法

Adding new methods to the Apache mahout

我正在尝试对推荐系统进行一些工作和研究。我想使用 Apache Mahout。但是,我想添加一些方法,因为现在没有它们的实现。我尝试这样做,但 Mahout 的源代码被锁定,我无法添加或更改任何内容。我想知道是否有人知道如何解决这个问题。

Gihub 上的项目分叉到您自己的存储库中。进行所需的修改,如果它们足够好,则创建一个 "pull request" 返回给 Mahout。他们可能会被纳入主流。

请注意 Mahout 不接受旧式 Hadoop "mapreduce" 代码。新的 Mahout 基于更现代的计算后端,主要是 Spark,但最近是 Flink。该项目也主要是 Scala,尽管这不是必需的。

现代 Mahout Recommender 支持通过 SimilarityAnalysis.cooccurrenceSimilarityAnalysis.rowsimilarity 提供。这些提供协作过滤和基于内容的推荐,但必须使用 knn/search 引擎提供服务。请参阅 Mahout 文档 here and a full running recommender here: https://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation