使用互信息作为相似性度量的层次聚类?

Hierarchical clustering using Mutual Information as similarity measure?

我想使用 scipy.cluster.hierarchy.linkage to compute a linkage structure on my data. The similarity measure I need to use is Mutual Information。我可以很容易地计算出相应的相似度矩阵。但是,linkage 函数只接受距离矩阵。

使用 scipy(或另一个 python 库),如何使用互信息作为相似性度量来计算链接结构? 我可以将相似矩阵转换为距离矩阵吗?

根据 scipy 中的 paragraph on wikipedia that @cel pointed to, the Jaccard distance is a distance variant of Mutual Information. The module distance.pdist 支持使用 Jaccard 距离计算距离矩阵。