什么是多目标聚类?

What is multiobjective clustering?

我不明白什么是多目标聚类,是使用多个变量进行聚类还是什么? 我知道堆栈溢出可能不是解决这类问题的最佳方法,但是 我在其他网站上问过,但没有得到回应。

多目标优化通常意味着您有多个感兴趣的标准,不能简单地转换为可比较的标准。例如,当您尝试拥有非常快的模型和非常准确的模型时,请考虑问题。时间以 s 为单位,精度以 % 为单位。你如何比较 (1s, 90%) 和 (10days, 92%)?哪一个更好?一般没有答案。因此,人们通常会做的事情——他们寻找帕累托前沿,所以你测试 K 个模型并选择其中的 M <= K,这样,其中 none 显然是 "beaten"。例如,如果我们将 (1s, 91%) 添加到前面的示例中,帕累托前沿将是 {(1s, 91%), (10days, 92%)} (as (1s, 90%) < (1s, 91%) , 其余的无法比较)。

现在您可以在集群设置中应用相同的问题。举例来说,您想要构建一个模型,该模型可以快速对新实例进行分类,最小化平均。每个集群内的距离,并且不会在每个集群中放入太多标有 X 的特殊实例。然后您将再次获得模型(集群),这些模型现在以 3 个不可比较的度量为特征,并且在多目标集群中您尝试处理这些问题(例如找到此类聚类的帕累托前沿)。