为什么聚类后需要对数据进行分类?
Why do I need classify Data after clustering?
我几乎是数据挖掘领域的新手。我聚类了一组数据。为什么我需要分类?
例如我的聚类数据是:
cluster A:
Age: 25
average: 12.5
cluster B:
age: 24
average = 14
我为预测聚类数据 'sex':
A --> Male
B --> Female
首先我可以得出女性的平均水平更高的结论吗?如果是这样,为什么我需要使用分类?
聚类后不需要分类
你的方法对我来说没有意义,你的结果很可能是不正确的。
如果您想计算平均年龄,请在数据的 M/F 子集上计算它们。 不要假设您的集群同意例如gender 这通常是行不通的。如果您知道所需的集群,请不要使用集群,而是使用您的 类.
聚类总是给你的结果增加不确定性。仅使用它来探索数据中的结构,但永远不要假设聚类是正确的。哪有这回事。它是一种帮助您找到查看数据的新方法的工具,但不能取代批判性思维和人工检查。
我几乎是数据挖掘领域的新手。我聚类了一组数据。为什么我需要分类? 例如我的聚类数据是:
cluster A:
Age: 25
average: 12.5
cluster B:
age: 24
average = 14
我为预测聚类数据 'sex':
A --> Male
B --> Female
首先我可以得出女性的平均水平更高的结论吗?如果是这样,为什么我需要使用分类?
聚类后不需要分类
你的方法对我来说没有意义,你的结果很可能是不正确的。
如果您想计算平均年龄,请在数据的 M/F 子集上计算它们。 不要假设您的集群同意例如gender 这通常是行不通的。如果您知道所需的集群,请不要使用集群,而是使用您的 类.
聚类总是给你的结果增加不确定性。仅使用它来探索数据中的结构,但永远不要假设聚类是正确的。哪有这回事。它是一种帮助您找到查看数据的新方法的工具,但不能取代批判性思维和人工检查。