是基于项目还是基于内容的协同过滤?

Is it Item based or content based Collaborative filtering?

我目前正在开发一个现有系统,该系统推荐与用户喜欢的先前项目相似的项目。

它使用交替最小二乘协同过滤来查找用户和项目的特征向量。然后它使用项目的特征向量并使用余弦相似性度量来找到与其相似的项目。

但是,我想澄清一下这是基于项目的 CF 还是基于内容的过滤?我的倾向是两者兼而有之。既然是用相似性度量来比较items,但是items在特征向量的内容上?

谢谢,

如果我理解正确,您是从 users-like-items 数据中提取项目的特征向量,那么它是纯粹的 item-based CF

为了成为基于内容的过滤,应该使用项目本身的特征:例如,如果项目是电影,基于内容的过滤应该利用电影的长度或导演等特征上,但不是基于其他用户偏好的功能。

我猜你的倾向是对的,你正在结合内容和协同过滤。如果您使用的是基于内容的,那么项目和用户的向量可以称为数据的 x_i(如数据点),而 A_ij 是输入数组中说明用户评分的单元格我给项目 j 的金额可以表示为 y_i。 您正在使用 cosine-similarity 查找 item-item 和 user-user 之间的相似性。 我想在你的场景中你应该去合作。

尝试制作item-item的矩阵,然后计算余弦相似度。