通过单个点绘制每个集群(Kmeans 聚类)
Plot each cluster by a single point (Kmeans Clustering)
我已将不同的文本聚类为 15 个聚类。
文本格式为:
"Oreo Biscuit is good"
"Healthy Breakfast
"Cars are fast"
....
我将文本转换成100维的Word2Vec。现在我有 15 个簇,我想绘制它们。
我不想绘制所有点,而是想为每个聚类绘制 1 个点,这样图中就有 15 个点。我该怎么做?
想法:
1) Use the cluster centre to plot each cluster.
Is there any other way (Converting all the Word2vecs in a cluster into
Doc2vec) or
Can Mds (Multi Dimensional Scaling) be used to plot the .
clusters?
谢谢
您已经有了每个文本的矢量表示。你也有这些文本的集群。您有以下非常微不足道的选项:
- 您只需使用某种降维机制绘制聚类质心。 (优点:简单,缺点:没有关于每个单独集群的优点的信息)
- 您仍然绘制聚类质心,但可以使用一些气泡图将这些时间方差添加为第三维,如图 here 所示。 (优点:包括均值和方差,缺点: K-mean太简单了)
- 我们可以应用一些谱聚类方法,然后在其上应用上述方法。
我已将不同的文本聚类为 15 个聚类。
文本格式为:
"Oreo Biscuit is good"
"Healthy Breakfast
"Cars are fast"
....
我将文本转换成100维的Word2Vec。现在我有 15 个簇,我想绘制它们。
我不想绘制所有点,而是想为每个聚类绘制 1 个点,这样图中就有 15 个点。我该怎么做?
想法:
1) Use the cluster centre to plot each cluster.
Is there any other way (Converting all the Word2vecs in a cluster into
Doc2vec) or
Can Mds (Multi Dimensional Scaling) be used to plot the .
clusters?
谢谢
您已经有了每个文本的矢量表示。你也有这些文本的集群。您有以下非常微不足道的选项:
- 您只需使用某种降维机制绘制聚类质心。 (优点:简单,缺点:没有关于每个单独集群的优点的信息)
- 您仍然绘制聚类质心,但可以使用一些气泡图将这些时间方差添加为第三维,如图 here 所示。 (优点:包括均值和方差,缺点: K-mean太简单了)
- 我们可以应用一些谱聚类方法,然后在其上应用上述方法。