LightFM：权重和样本权重

LightFM: Weights and Sample Weights

recommendation-engine

我希望深入了解以下 LightFM 实施的权重：

样本权重

fit方法中的sample_weights是什么？我读到它们是为了模拟时间衰减，但它究竟是如何工作的呢？对此进行解释的示例或文章将非常有帮助。

交互矩阵

现在，如果我有与不同 content_type 的用户交互，即 text、video，而我们不想在提出建议时真正区分它们？
- 我是否必须为每种媒体类型制作单独的模型？如果我创建一个模型，如果 text 的交互是一个布尔值，例如 1.0/0.0 的点击次数，如果 video 的交互在 percentage_video_completed 中，例如如果用户在 15 秒的视频中看到 10 秒，我可以将权重指定为 0.667 吗？

样本权重

您可以使用 sample_weights 来衡量任何一个观察的重要性，就像您可以将 sample_weight 传递给 sklearn classifier.

大于 1 的权重将为该观察提供额外的权重；小于 1 的权重会降低它对模型的重要性。

这是通过按其权重缩放该观察的学习率来实现的。

互动

您不必创建单独的模型：两种类型的交互可以愉快地嵌入到同一模型中。

在 LightFM 模型中，交互矩阵中的数据是二进制的。您应该使用样本权重来表达您对给定交互是积极的信心。这可以是电影的观看百分比：但是，请注意，如果观看百分比通常低于 1.0，您的模型将更加重视文本交互。