自动生成 k 值的 K-means 聚类

K-means clustering with k value generated automatically

如何在不给出 k 值的情况下在 k-means 算法中生成聚类。 我想做 k-means 聚类并自动生成聚类。

您可以尝试均值偏移聚类,它的行为类似于 k 均值聚类并且没有 k 参数。

基本思想如下:聚类就像在你的数据集中增加"high frequencies",或者"sharpening"你的数据集,为了找到"modes"("modes" 对应于数据集中的重要 "trends")。 逆操作,即平滑数据集,更容易定义(简而言之,用其邻居的平均值替换每个样本)。因此,从这个定义中,您可以提取信号的 "high frequency" 分量,作为初始信号和平滑信号之间的差异。这将为您提供 "gradient direction" 或 "good move" 来增强信号。在这个过程的最后,所有的样本都会聚集在少量的点上,对应于"modes".

参考: https://en.wikipedia.org/wiki/Mean_shift

X-meansK-means变体),在Weka[=23中实现=].有关详细信息,请参阅文档: