java

Question

我有以下输入整数向量（示例）：

4 138 233 461 610 621 669 742 814 827
89 138 334 656 697 810
138
138 196 738
659 738
4 461
138 337 756 810
8 138 196 337 468 663 664 756 809 810

它们都包含整数值 [1-850] 并且都存储在 csv 文件中。

我想根据向量的相似性将它们分成多个集群，但我对如何在 java 中为我的输入数据实施 k-means 算法感到困惑。有人愿意提供提示或代码帮助吗？

提前致谢。

Answer 1

k 均值聚类的伪代码

假设您有一个可以比较输入对象（在您的例子中是向量）并输出相似性度量的度量（我们称之为 M）。

和一个能够计算一组输入对象的平均值的函数（我们称之为 A）

java - k 均值聚类