自动生成 k 值的 K-means 聚类
K-means clustering with k value generated automatically
如何在不给出 k 值的情况下在 k-means 算法中生成聚类。
我想做 k-means 聚类并自动生成聚类。
您可以尝试均值偏移聚类,它的行为类似于 k 均值聚类并且没有 k 参数。
基本思想如下:聚类就像在你的数据集中增加"high frequencies",或者"sharpening"你的数据集,为了找到"modes"("modes" 对应于数据集中的重要 "trends")。
逆操作,即平滑数据集,更容易定义(简而言之,用其邻居的平均值替换每个样本)。因此,从这个定义中,您可以提取信号的 "high frequency" 分量,作为初始信号和平滑信号之间的差异。这将为您提供 "gradient direction" 或 "good move" 来增强信号。在这个过程的最后,所有的样本都会聚集在少量的点上,对应于"modes".
有X-means(K-means变体),在Weka[=23中实现=].有关详细信息,请参阅文档:
如何在不给出 k 值的情况下在 k-means 算法中生成聚类。 我想做 k-means 聚类并自动生成聚类。
您可以尝试均值偏移聚类,它的行为类似于 k 均值聚类并且没有 k 参数。
基本思想如下:聚类就像在你的数据集中增加"high frequencies",或者"sharpening"你的数据集,为了找到"modes"("modes" 对应于数据集中的重要 "trends")。 逆操作,即平滑数据集,更容易定义(简而言之,用其邻居的平均值替换每个样本)。因此,从这个定义中,您可以提取信号的 "high frequency" 分量,作为初始信号和平滑信号之间的差异。这将为您提供 "gradient direction" 或 "good move" 来增强信号。在这个过程的最后,所有的样本都会聚集在少量的点上,对应于"modes".
有X-means(K-means变体),在Weka[=23中实现=].有关详细信息,请参阅文档: