无监督学习减少 dimensionality/clustering

Unsupervised learning reduce dimensionality/clustering

我正在尝试了解如何使用无监督学习将我的数据分成集群。例如,k-means 方法。

我有 20 列数据,如何将其投影到 2D 表面上而不丢失 18 列的必要信息?

我应该用什么来做到这一点?

任何帮助将不胜感激。

如果您只是对查看二维数据感兴趣,请考虑使用 t-SNE。 scikit-learn python 包有一个很好的实现,您可以使用。但是,请记住,您不应该将数据聚类到 t-SNE 输出上,因为 space 您的数据所在的过程在此过程中会充分扭曲(仅保留短距离,而较长的距离会被严重更改为要么更短要么更长)