Azure 机器学习:多类分类算法出错
Azure Machine learning: error with multiclass classification algo
我有 training set and test set(带有 header 的 csv 文件),我必须在其中对每个值进行分类。 X 列有 118.000 个 uniq 值,而 y1 列只有大约 13000 个,所以会有 13000 个类别。
从训练集中我只需要 X
和 y1
列来训练模型。我需要将 X 值分类到其中一个类别(从初始词中找到正常值)。我尝试了所有多算法但未能尝试评估模型。
可视化分数模型return这个:
可能是什么问题,它只是 returns -2 代码作为错误和这个 log
UPD1:通过项目列模块下的元数据编辑器模块将列 y1 设为分类,似乎没有任何变化
Moncef 提供了 here 我的问题的解决方案:
关键是 Azure 对最大类别 8192 有限制,这就是为什么应该通过 R 或 python 模块或创建自己的评估模块来减少数量。或者还有另一种方法,可以跳过评估步骤,因为模型已经成功训练。
我有 training set and test set(带有 header 的 csv 文件),我必须在其中对每个值进行分类。 X 列有 118.000 个 uniq 值,而 y1 列只有大约 13000 个,所以会有 13000 个类别。
从训练集中我只需要 X
和 y1
列来训练模型。我需要将 X 值分类到其中一个类别(从初始词中找到正常值)。我尝试了所有多算法但未能尝试评估模型。
可视化分数模型return这个:
可能是什么问题,它只是 returns -2 代码作为错误和这个 log
UPD1:通过项目列模块下的元数据编辑器模块将列 y1 设为分类,似乎没有任何变化
Moncef 提供了 here 我的问题的解决方案:
关键是 Azure 对最大类别 8192 有限制,这就是为什么应该通过 R 或 python 模块或创建自己的评估模块来减少数量。或者还有另一种方法,可以跳过评估步骤,因为模型已经成功训练。