使用 H20.ai 的多标签分类(Driverless ai)

Multilabel classification using H20.ai (Driverless ai)


我们正在测试无人驾驶人工智能的能力。我们的第一个数据集是这样的。 X1,X2.... X400, Y1,Y2...Y200
在这里,我们想对我们的数据集进行多标签 class 化。 但是,在无人驾驶AI web 客户端中,只有一个选项可以指定一个目标。

我尝试过的另一种方法是将所有 Y 变量连接到一个列表中。
然而,h20.ai 不是预测每个 Y 变量,而是将每个数字序列视为 class.
就像有 3 个 Y 变量一样。
然后 [0 0 1] 和 [0 1 0] 等等直到 8 classes.
然后在训练时,它只是抱怨这 8 classes 中的一些没有足够的行并丢弃它们。在我的例子中,我有超过 200 个 Y 变量,所以它删除了很多这样的 classes.

有人知道在无人驾驶 AI 中执行此操作的任何解决方案吗?

谢谢

无人驾驶AI暂不支持multi-label。一种选择是为每个 class 创建一个模型(这就是 multi-class 建模所做的)。 200 Y variables/classes 很多,所以你可能想使用 Python 客户端来自动化它,但这需要一些时间来 运行 它们并进行评估。不妨试试前 5 classes,看看他们的表现如何。考虑将 200 classes 分组以简化它可能会有所帮助。