用于从智能家居数据中挖掘人类 activity 模式的 KMeans 算法

KMeans algorithm for mining human activity pattern from smart home data

我正在从事数据挖掘项目,以从智能电表数据中挖掘人类 activity 模式。我无法找到 KMeans 的解决方案或如何使用 KMeans 算法进行聚类。

数据是这样的,一天分为48个时段,每个时段30分钟,那个时段有活动的设备。

现在我想创建像一天中的时间(早上、下午、 傍晚、夜晚)、工作日、星期 and/or 一年中的月份、季节。 我应该遵循什么方法来使用 KMeans 获得结果?

KMeans 不能以明显的方式以有意义的方式用于此。

该算法是为连续变量设计的,它计算均值(因此得名),以及与均值的平方偏差被最小化。但是您的数据不是连续的。使用平均设备 ID 和偏差平方没有意义。