LightFM:权重和样本权重
LightFM: Weights and Sample Weights
我希望深入了解以下 LightFM 实施的权重:
样本权重
fit
方法中的sample_weights
是什么?我读到它们是为了模拟时间衰减,但它究竟是如何工作的呢?对此进行解释的示例或文章将非常有帮助。
交互矩阵
- 现在,如果我有与不同
content_type
的用户交互,即 text
、video
,而我们不想在提出建议时真正区分它们?
- 我是否必须为每种媒体类型制作单独的模型?如果我创建一个模型,如果
text
的交互是一个布尔值,例如 1.0/0.0 的点击次数,如果 video
的交互在 percentage_video_completed
中,例如如果用户在 15 秒的视频中看到 10 秒,我可以将权重指定为 0.667 吗?
样本权重
您可以使用 sample_weights
来衡量任何一个观察的重要性,就像您可以将 sample_weight
传递给 sklearn classifier.
大于 1 的权重将为该观察提供额外的权重;小于 1 的权重会降低它对模型的重要性。
这是通过按其权重缩放该观察的学习率来实现的。
互动
您不必创建单独的模型:两种类型的交互可以愉快地嵌入到同一模型中。
在 LightFM 模型中,交互矩阵中的数据是二进制的。您应该使用样本权重来表达您对给定交互是积极的信心。这可以是电影的观看百分比:但是,请注意,如果观看百分比通常低于 1.0,您的模型将更加重视文本交互。
我希望深入了解以下 LightFM 实施的权重:
样本权重
fit
方法中的sample_weights
是什么?我读到它们是为了模拟时间衰减,但它究竟是如何工作的呢?对此进行解释的示例或文章将非常有帮助。
交互矩阵
- 现在,如果我有与不同
content_type
的用户交互,即text
、video
,而我们不想在提出建议时真正区分它们?- 我是否必须为每种媒体类型制作单独的模型?如果我创建一个模型,如果
text
的交互是一个布尔值,例如 1.0/0.0 的点击次数,如果video
的交互在percentage_video_completed
中,例如如果用户在 15 秒的视频中看到 10 秒,我可以将权重指定为 0.667 吗?
- 我是否必须为每种媒体类型制作单独的模型?如果我创建一个模型,如果
样本权重
您可以使用 sample_weights
来衡量任何一个观察的重要性,就像您可以将 sample_weight
传递给 sklearn classifier.
大于 1 的权重将为该观察提供额外的权重;小于 1 的权重会降低它对模型的重要性。
这是通过按其权重缩放该观察的学习率来实现的。
互动
您不必创建单独的模型:两种类型的交互可以愉快地嵌入到同一模型中。
在 LightFM 模型中,交互矩阵中的数据是二进制的。您应该使用样本权重来表达您对给定交互是积极的信心。这可以是电影的观看百分比:但是,请注意,如果观看百分比通常低于 1.0,您的模型将更加重视文本交互。