使用for循环对不同的链接进行层次聚类
Using For Loop to Hierarchical Cluster Different Linkages
我正在尝试在各种距离矩阵上执行多个层次聚类,并使用不同的链接进行比较。
为了简化任务,我尝试制作一个函数,该函数将迭代一组链接方法以生成 agnes
对象,但无济于事。
这是函数应该做什么的示例:
library(cluster)
Links <- c("single","average","ward") # vector of linkage methods
ClustH <- list() # list to hold HClusts
set.seed(123)
A <- rnorm(3, mean = 5, sd = 1)
B <- rnorm(3, mean = 2, sd = 1)
C <- rnorm(3, mean = 0, sd = 1)
DMat <- as.dist(cbind(A,B,C)) # distance matrix
for(i in 1:length(Links)){
ClustH[i] <- agnes(DMat, method = Links[i])
}
ClustH[1]
#[[1]]
#[1] 1 2 3
它不是在列表的每个元素中保存整个 agnes 对象,而是只保存通过 <agnes object>$order
获得的对象的第一个元素(即顺序)
我做错了什么?您不能将列出的对象保存在列表中吗?有什么建议吗?
回答
修改循环以使用 [[
而不是 [
:
ClustH[[i]] <- agnes(DMat, method = Links[i])
理由
使用 [
和 [[
进行子集化时,列表具有特定的行为。使用 [
,我们实际上采用给定长度的列表子集。输出将始终是一个列表,只是它的一个子集。使用 [[
,我们可以直接访问列表的一个元素。例如:
m <- list(1, 2, 3)
m[1]
#[[1]]
#[1] 1
m[[1]]
# [1] 1
由于 agnes
的输出实际上也是一个列表,它试图用 agnes
输出的元素覆盖 ClustH
的元素。由于i
的长度为1
,它只会用agnes
输出的第一个元素覆盖一个元素:
List of 8
$ order : int [1:3] 1 2 3
$ height : num [1:2] 4.77 3.72
$ ac : num 0.147
$ merge : int [1:2, 1:2] -2 -1 -3 1
$ diss : 'dissimilarity' num [1:3] 4.77 6.56 3.72
..- attr(*, "Labels")= chr [1:3] "A" "B" "C"
..- attr(*, "Size")= num 3
..- attr(*, "call")= language as.dist.default(m = cbind(A, B, C))
..- attr(*, "Diag")= logi FALSE
..- attr(*, "Upper")= logi FALSE
..- attr(*, "Metric")= chr "unspecified"
$ call : language agnes(x = DMat, method = Links[1])
$ method : chr "single"
$ order.lab: chr [1:3] "A" "B" "C"
- attr(*, "class")= chr [1:2] "agnes" "twins"
换句话说,整数向量1 2 3
。
建议
如果你想有一个列表作为你的输出,你也可以考虑切换到lapply
:
ClustH <- lapply(Links, function(x) agnes(DMat, methods = x))
# From R version 4.1 onwards, this also works
ClustH <- lapply(Links, \(x) agnes(DMat, methods = x))
我正在尝试在各种距离矩阵上执行多个层次聚类,并使用不同的链接进行比较。
为了简化任务,我尝试制作一个函数,该函数将迭代一组链接方法以生成 agnes
对象,但无济于事。
这是函数应该做什么的示例:
library(cluster)
Links <- c("single","average","ward") # vector of linkage methods
ClustH <- list() # list to hold HClusts
set.seed(123)
A <- rnorm(3, mean = 5, sd = 1)
B <- rnorm(3, mean = 2, sd = 1)
C <- rnorm(3, mean = 0, sd = 1)
DMat <- as.dist(cbind(A,B,C)) # distance matrix
for(i in 1:length(Links)){
ClustH[i] <- agnes(DMat, method = Links[i])
}
ClustH[1]
#[[1]]
#[1] 1 2 3
它不是在列表的每个元素中保存整个 agnes 对象,而是只保存通过 <agnes object>$order
我做错了什么?您不能将列出的对象保存在列表中吗?有什么建议吗?
回答
修改循环以使用 [[
而不是 [
:
ClustH[[i]] <- agnes(DMat, method = Links[i])
理由
使用 [
和 [[
进行子集化时,列表具有特定的行为。使用 [
,我们实际上采用给定长度的列表子集。输出将始终是一个列表,只是它的一个子集。使用 [[
,我们可以直接访问列表的一个元素。例如:
m <- list(1, 2, 3)
m[1]
#[[1]]
#[1] 1
m[[1]]
# [1] 1
由于 agnes
的输出实际上也是一个列表,它试图用 agnes
输出的元素覆盖 ClustH
的元素。由于i
的长度为1
,它只会用agnes
输出的第一个元素覆盖一个元素:
List of 8
$ order : int [1:3] 1 2 3
$ height : num [1:2] 4.77 3.72
$ ac : num 0.147
$ merge : int [1:2, 1:2] -2 -1 -3 1
$ diss : 'dissimilarity' num [1:3] 4.77 6.56 3.72
..- attr(*, "Labels")= chr [1:3] "A" "B" "C"
..- attr(*, "Size")= num 3
..- attr(*, "call")= language as.dist.default(m = cbind(A, B, C))
..- attr(*, "Diag")= logi FALSE
..- attr(*, "Upper")= logi FALSE
..- attr(*, "Metric")= chr "unspecified"
$ call : language agnes(x = DMat, method = Links[1])
$ method : chr "single"
$ order.lab: chr [1:3] "A" "B" "C"
- attr(*, "class")= chr [1:2] "agnes" "twins"
换句话说,整数向量1 2 3
。
建议
如果你想有一个列表作为你的输出,你也可以考虑切换到lapply
:
ClustH <- lapply(Links, function(x) agnes(DMat, methods = x))
# From R version 4.1 onwards, this also works
ClustH <- lapply(Links, \(x) agnes(DMat, methods = x))