哪种聚类算法最适合聚类一维特征?

which clustering algorithm is best for clustering one-dimensional features?

哪种聚类机器学习算法最适合用于聚类一维数值特征(标量值)? 是 Birch、谱聚类、k-means、DBSCAN...还是其他?

看看K-means clustering algorithm。该算法对于聚类一维特征向量非常有效。但是 K 意味着当你的训练数据集中有异常值时聚类算法不能很好地工作,在这种情况下你可以使用一些高级机器学习算法。

我建议在为您的数据集和问题陈述实施机器学习算法(分类、聚类等)之前,您可以使用此处的 Weka Toolkit to check which algorithm best fits your problem statement. Weka toolkit is a collection of a large number of machine learning and data mining algorithms that can be easily implemented for a given question. Once you have identified which algorithm works best for your problem, you can modify or write your own implementation of the algorithm. By tweaking it, you can even achieve more accuracy. You can download weka。

所有这些方法都更适合多元数据。除了历史上用于一维数据的 k-means 之外,它们都是 设计时考虑到多变量问题 ,其中 none 针对特定情况进行了很好的优化一维数据。

对于一维数据,使用核密度估计。 KDE 在 1d 中是一项很好的技术,具有强大的统计支持,并且很难用于多维聚类。