推荐器拆分返回空数据集
Recommender Split Returning Empty Dataset
我正在使用 "Split Data" 模块设置为推荐器拆分以拆分数据以训练和测试火柴盒推荐器。输入数据是一个有效的用户项目评分元组(例如,575978 - 157381 - 3),除了将其更改为 .75 和 . 25分。但是,当此模块完成时,它 returns 数据集 1 的完整、未拆分的数据集和数据集 2 的完全空(但已标记)的数据集。使用 "Split Rows" 模式进行分层拆分时也会发生这种情况。知道发生了什么事吗?
谢谢。
编辑:包括我的数据样本。
UserID ItemID Rating
835793 165937 3
154738 11214 3
938459 748288 3
819375 789768 6
738571 98987 3
847509 153777 3
991757 124458 3
968685 288070 2
236349 8337 3
127299 545885 3
想通了。在我的 "Remove Duplicate Rows" 模块链中,我只是通过 UserID 而不是 UserID and ItemID 删除了重复项。这仍然留下了很多行,但我假设它扰乱了分层。
我正在使用 "Split Data" 模块设置为推荐器拆分以拆分数据以训练和测试火柴盒推荐器。输入数据是一个有效的用户项目评分元组(例如,575978 - 157381 - 3),除了将其更改为 .75 和 . 25分。但是,当此模块完成时,它 returns 数据集 1 的完整、未拆分的数据集和数据集 2 的完全空(但已标记)的数据集。使用 "Split Rows" 模式进行分层拆分时也会发生这种情况。知道发生了什么事吗?
谢谢。
编辑:包括我的数据样本。
UserID ItemID Rating
835793 165937 3
154738 11214 3
938459 748288 3
819375 789768 6
738571 98987 3
847509 153777 3
991757 124458 3
968685 288070 2
236349 8337 3
127299 545885 3
想通了。在我的 "Remove Duplicate Rows" 模块链中,我只是通过 UserID 而不是 UserID and ItemID 删除了重复项。这仍然留下了很多行,但我假设它扰乱了分层。