如何将距离矩阵插入 R 和 运行 层次聚类

How to insert a distance matrix into R and run hierarchical clustering

我知道如果我有原始数据,我可以创建一个距离矩阵,但是对于这个问题,我有一个距离矩阵,我希望能够在 R 中对它执行 运行 命令,比如 hclust。下面是我想要在 R 中使用的距离矩阵。我不确定以矩阵形式存储这些数据是否有效,因为我将无法 运行 hclust 在矩阵上。

我尝试使用 as.dist 函数创建它,但没有成功。我的错误代码:

test=as.dist(c(.76,2.97,4.88,3.86,.8,4.17,1.96,.21,1.51,.51), diag = FALSE, upper = FALSE)
test
      1    2    3    4    5    6    7    8    9
2  2.97                                        
3  4.88 2.97                                   
4  3.86 4.88 0.51                              
5  0.80 3.86 2.97 0.21                         
6  4.17 0.80 4.88 1.51 0.80                    
7  1.96 4.17 3.86 0.51 4.17 0.51               
8  0.21 1.96 0.80 2.97 1.96 2.97 0.80          
9  1.51 0.21 4.17 4.88 0.21 4.88 4.17 0.21     
10 0.51 1.51 1.96 3.86 1.51 3.86 1.96 1.51 0.51

由于您已经有了距离值,因此不需要使用 dist() 来计算它们。数据可以存储在一个正则矩阵中

test <- matrix(ncol=5,nrow=5)
test[lower.tri(test)] <- c(.76,2.97,4.88,3.86,.8,4.17,1.96,.21,1.51,.51)
diag(test) <- 0

> test
     [,1] [,2] [,3] [,4] [,5]
[1,] 0.00   NA   NA   NA   NA
[2,] 0.76 0.00   NA   NA   NA
[3,] 2.97 0.80 0.00   NA   NA
[4,] 4.88 4.17 0.21 0.00   NA
[5,] 3.86 1.96 1.51 0.51    0

为了应用hclust(),这个矩阵可以用as.dist()转换成距离矩阵:

> test <- as.dist(test, diag = TRUE)
     1    2    3    4    5
1 0.00                    
2 0.76 0.00               
3 2.97 0.80 0.00          
4 4.88 4.17 0.21 0.00     
5 3.86 1.96 1.51 0.51 0.00
> hclust(test)
#
#Call:
#hclust(d = test)
#
#Cluster method   : complete 
#Number of objects: 5 
> plot(hclust(test))