自动生成 k 值的 K-means 聚类

K-means clustering with k value generated automatically

如何在不给出 k 值的情况下在 k-means 算法中生成聚类。我想做 k-means 聚类并自动生成聚类。

您可以尝试均值偏移聚类，它的行为类似于 k 均值聚类并且没有 k 参数。

基本思想如下：聚类就像在你的数据集中增加"high frequencies"，或者"sharpening"你的数据集，为了找到"modes"（"modes" 对应于数据集中的重要 "trends"）。逆操作，即平滑数据集，更容易定义（简而言之，用其邻居的平均值替换每个样本）。因此，从这个定义中，您可以提取信号的 "high frequency" 分量，作为初始信号和平滑信号之间的差异。这将为您提供 "gradient direction" 或 "good move" 来增强信号。在这个过程的最后，所有的样本都会聚集在少量的点上，对应于"modes".

参考： https://en.wikipedia.org/wiki/Mean_shift

有X-means（K-means变体），在Weka[=23中实现=].有关详细信息，请参阅文档：

http://www.cs.cmu.edu/~dpelleg/download/xmeans.pdf

http://weka.sourceforge.net/doc.packages/XMeans/weka/clusterers/XMeans.html

http://www.cs.cmu.edu/~dpelleg/kmeans.html

自动生成 k 值的 K-means 聚类

K-means clustering with k value generated automatically

cluster-analysis

data-mining

k-means