如何从数组中预测 class?

How to predict a class from an array?

我有以下数据科学问题:我有一组数组。一个数组表示 个月的照明、供暖或通风消耗 ,其中每行表示 一个小时 的消耗。所以对于一年中的每个月,我都有 3 个数组。

例如,一个表示 2019 年 3 月供暖消耗的数组如下所示:

目的是预测一个月消耗的消耗类型(照明、取暖或通风)。 所以,如果我想使用决策树或神经网络。我如何 调整数据 变量是什么?通常,一行是数据,列是变量,但在我的例子中,一组行代表 "one data",我不知道变量是什么。

我尝试计算最大值、最小值、标准差、平均值等...总结一个数组只是一行。但是,我想知道是否有另一种方法可以用一组数组进行这种预测。

谢谢。

您的数据格式没有问题。

变量是什么? 所以你说你想 class 化给定的一个月的数组?那么您的变量将是整个月的数组。不是单独的行(或您所指的行)。因此,在您的模型中,一个数据就是一个月,因为这是您希望模型学习和预测(或 classify)的数据。

此外,如果您使用的是神经网络架构,那么在训练阶段您显然需要标签。您不应该为每一行或每一小时都提供一个标签,而应该为每个月提供一个标签。

您可以采用平均值或中位数或当月的任何统计数据来构建特征,但这是神经网络的工作。

我不知道你的数据集的大小,但如果每个 class 的月数不多,你将 运行 遇到一些问题。

我希望这能让您朝着正确的方向前进并解决问题。

编辑:打字错误