向 Apache mahout 添加新方法
Adding new methods to the Apache mahout
我正在尝试对推荐系统进行一些工作和研究。我想使用 Apache Mahout。但是,我想添加一些方法,因为现在没有它们的实现。我尝试这样做,但 Mahout 的源代码被锁定,我无法添加或更改任何内容。我想知道是否有人知道如何解决这个问题。
将 Gihub 上的项目分叉到您自己的存储库中。进行所需的修改,如果它们足够好,则创建一个 "pull request" 返回给 Mahout。他们可能会被纳入主流。
请注意 Mahout 不接受旧式 Hadoop "mapreduce" 代码。新的 Mahout 基于更现代的计算后端,主要是 Spark,但最近是 Flink。该项目也主要是 Scala,尽管这不是必需的。
现代 Mahout Recommender 支持通过 SimilarityAnalysis.cooccurrence
和 SimilarityAnalysis.rowsimilarity
提供。这些提供协作过滤和基于内容的推荐,但必须使用 knn/search 引擎提供服务。请参阅 Mahout 文档 here and a full running recommender here: https://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation
我正在尝试对推荐系统进行一些工作和研究。我想使用 Apache Mahout。但是,我想添加一些方法,因为现在没有它们的实现。我尝试这样做,但 Mahout 的源代码被锁定,我无法添加或更改任何内容。我想知道是否有人知道如何解决这个问题。
将 Gihub 上的项目分叉到您自己的存储库中。进行所需的修改,如果它们足够好,则创建一个 "pull request" 返回给 Mahout。他们可能会被纳入主流。
请注意 Mahout 不接受旧式 Hadoop "mapreduce" 代码。新的 Mahout 基于更现代的计算后端,主要是 Spark,但最近是 Flink。该项目也主要是 Scala,尽管这不是必需的。
现代 Mahout Recommender 支持通过 SimilarityAnalysis.cooccurrence
和 SimilarityAnalysis.rowsimilarity
提供。这些提供协作过滤和基于内容的推荐,但必须使用 knn/search 引擎提供服务。请参阅 Mahout 文档 here and a full running recommender here: https://templates.prediction.io/PredictionIO/template-scala-parallel-universal-recommendation