如何在 Apache mahout 中合并两个相似实例
how to combine two similarity instances in Apache mahout
我是 Apache mahout 的新手,我有一些疑问,如果我错了请纠正我。
假设我们有数据集并根据数据集计算推荐,然后将结果显示给用户,当用户再次访问我们的网站时,我们将有新的数据集,因此我们必须根据新数据集再次计算推荐。
我们可以通过组合两个数据集来做到这一点,即旧数据集和新数据集,但是由于我们已经对旧数据集进行了计算,如果我们将它们组合在一起,那么我们将再次对旧数据集进行相同的计算,这将在数据增加时成为问题所以想问一下有没有其他方法可以做到这一点,我认为另一种方法是结合两个数据集的相似性,因为推荐是基于相似性的,但我找不到任何关于这个的东西。
请帮我解决这个问题,
谢谢
您想根据移动的 window 数据计算建议。确定您的 window 和更新频率。如果您每天更新并且 window 是 3 个月,那么您每天都会丢弃最旧的数据,并在每次更新时使用最近 3 个月的数据。
我是 Apache mahout 的新手,我有一些疑问,如果我错了请纠正我。
假设我们有数据集并根据数据集计算推荐,然后将结果显示给用户,当用户再次访问我们的网站时,我们将有新的数据集,因此我们必须根据新数据集再次计算推荐。
我们可以通过组合两个数据集来做到这一点,即旧数据集和新数据集,但是由于我们已经对旧数据集进行了计算,如果我们将它们组合在一起,那么我们将再次对旧数据集进行相同的计算,这将在数据增加时成为问题所以想问一下有没有其他方法可以做到这一点,我认为另一种方法是结合两个数据集的相似性,因为推荐是基于相似性的,但我找不到任何关于这个的东西。
请帮我解决这个问题,
谢谢
您想根据移动的 window 数据计算建议。确定您的 window 和更新频率。如果您每天更新并且 window 是 3 个月,那么您每天都会丢弃最旧的数据,并在每次更新时使用最近 3 个月的数据。