多维层次聚类 - python

multidimensional hierarchical clustering - python

有什么东西可以进行多维层次聚类吗?

我看过这些地方:

但到目前为止没有成功

含义:查找组的方式与使用 2 个维度相同,但使用多个维度

一些代码:

import pandas as pd
import numpy as np
set_of_values = pd.DataFrame(
    [np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),
     np.random.rand(10),],
     index=['temp differential', 'power differential', 'cost', 'time','output'],
    columns=range(10)).transpose()
print(set_of_values)

我想找到 ('temp differential'、'power differential'、'cost'、'time'、'output') 的所有聚类。不是图形化的,因为它是一个超平面。理想情况下输出像 [all the groups]:

GROUP #1: (a,b,c,d,e), (a',b',c',d',e'), ... , (a'',b'',c'',d'',e'') 
...
GROUP #n: ('a,'b,'c,'d,'e), ('a,'b,'c,'d,'e), ... , (''a,''b,''c,''d,''e) 

给定一个进步的门槛'clustering'。可行吗?

这是一个简单的例子。在这里,这是使用层次聚类对 4 个随机变量进行聚类:

%matplotlib inline
import matplotlib.pylab as plt
import seaborn as sns
import pandas as pd
import numpy as np

df = pd.DataFrame({"col" + str(num): np.random.randn(50) for num in range(1,5)})
sns.clustermap(df)

如果您关心了解树状图链接和阈值以获得聚类,seaborn 工具使用 scipy 和 this post 会有所帮助。

如果您想在 space 中将其可视化,我建议您使用主成分分析并绘制 PC1 与 PC2 http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_iris.html