使用for循环对不同的链接进行层次聚类

Using For Loop to Hierarchical Cluster Different Linkages

我正在尝试在各种距离矩阵上执行多个层次聚类,并使用不同的链接进行比较。

为了简化任务,我尝试制作一个函数,该函数将迭代一组链接方法以生成 agnes 对象,但无济于事。

这是函数应该做什么的示例:

library(cluster)
Links <- c("single","average","ward") # vector of linkage methods
ClustH <- list() # list to hold HClusts
set.seed(123)
A <- rnorm(3, mean = 5, sd = 1)
B <- rnorm(3, mean = 2, sd = 1)
C <- rnorm(3, mean = 0, sd = 1)
DMat <- as.dist(cbind(A,B,C)) # distance matrix
for(i in 1:length(Links)){
 ClustH[i] <- agnes(DMat, method = Links[i])
}
ClustH[1]
#[[1]]
#[1] 1 2 3

它不是在列表的每个元素中保存整个 agnes 对象,而是只保存通过 <agnes object>$order

获得的对象的第一个元素(即顺序)

我做错了什么?您不能将列出的对象保存在列表中吗?有什么建议吗?

回答

修改循环以使用 [[ 而不是 [:

ClustH[[i]] <- agnes(DMat, method = Links[i])

理由

使用 [[[ 进行子集化时,列表具有特定的行为。使用 [,我们实际上采用给定长度的列表子集。输出将始终是一个列表,只是它的一个子集。使用 [[,我们可以直接访问列表的一个元素。例如:

m <- list(1, 2, 3)
m[1]
#[[1]]
#[1] 1

m[[1]]
# [1] 1

由于 agnes 的输出实际上也是一个列表,它试图用 agnes 输出的元素覆盖 ClustH 的元素。由于i的长度为1,它只会用agnes输出的第一个元素覆盖一个元素:

List of 8
 $ order    : int [1:3] 1 2 3
 $ height   : num [1:2] 4.77 3.72
 $ ac       : num 0.147
 $ merge    : int [1:2, 1:2] -2 -1 -3 1
 $ diss     : 'dissimilarity' num [1:3] 4.77 6.56 3.72
  ..- attr(*, "Labels")= chr [1:3] "A" "B" "C"
  ..- attr(*, "Size")= num 3
  ..- attr(*, "call")= language as.dist.default(m = cbind(A, B, C))
  ..- attr(*, "Diag")= logi FALSE
  ..- attr(*, "Upper")= logi FALSE
  ..- attr(*, "Metric")= chr "unspecified"
 $ call     : language agnes(x = DMat, method = Links[1])
 $ method   : chr "single"
 $ order.lab: chr [1:3] "A" "B" "C"
 - attr(*, "class")= chr [1:2] "agnes" "twins"

换句话说,整数向量1 2 3

建议

如果你想有一个列表作为你的输出,你也可以考虑切换到lapply:

ClustH <- lapply(Links, function(x) agnes(DMat, methods = x))

# From R version 4.1 onwards, this also works
ClustH <- lapply(Links, \(x) agnes(DMat, methods = x))