有比 K 均值更快的聚类方法吗?

Any much faster methods for clustering than K means?

我在一个盒子里有手写数字,我想把手写数字拉出来。尺寸为 208 x 117,因此大约有 24k 像素。

我想利用我有颜色这一事实,所以我决定使用聚类算法来隔离数字的颜色,然后只提取那些像素。问题是我需要将其降低到每个数字 0.01 秒,现在 sklearn.cluster.KMeans 大约需要 0.15 秒。我尝试调整图像大小,但这本身就需要时间,而且我还尝试使用阈值来获取彩色像素并忽略浅色背景(让我降低到 10k 像素),但这并没有加快速度。

有什么想法吗?

我找到了一个方法。事实证明,通过减少样本量,您可以获得巨大的加速。所以我只是随机抽取了四分之一的像素并将其输入到聚类函数中。我得到了 50 倍的加速。