推荐器拆分返回空数据集

Recommender Split Returning Empty Dataset

我正在使用 "Split Data" 模块设置为推荐器拆分以拆分数据以训练和测试火柴盒推荐器。输入数据是一个有效的用户项目评分元组(例如,575978 - 157381 - 3),除了将其更改为 .75 和 . 25分。但是,当此模块完成时,它 returns 数据集 1 的完整、未拆分的数据集和数据集 2 的完全空(但已标记)的数据集。使用 "Split Rows" 模式进行分层拆分时也会发生这种情况。知道发生了什么事吗?

谢谢。

编辑:包括我的数据样本。

UserID  ItemID  Rating
835793  165937  3
154738  11214   3
938459  748288  3
819375  789768  6
738571  98987   3
847509  153777  3
991757  124458  3
968685  288070  2
236349  8337    3
127299  545885  3

想通了。在我的 "Remove Duplicate Rows" 模块链中,我只是通过 UserID 而不是 UserID and ItemID 删除了重复项。这仍然留下了很多行,但我假设它扰乱了分层。