如何在 R 中对 class "dendrogram" 的水平树状图使用识别

How to use identify to a horizontal dendrogram of class "dendrogram" in R

我正在使用 identify 探索 R 中树状图中簇的特定特征。Identify 通过使用 'hclust' 对象工作得非常好,但我需要它用于 的水平树状图class 'dendrogram' 而不是 'hclust'。我安装了包 dendextend,它通常应该将识别功能扩展到 class 树状图和水平树状图 (http://rpackages.ianhowson.com/cran/dendextend/man/identify.dendrogram.html) 的对象。对于我的特定数据集,识别适用于垂直树状图(class 树状图),但不适用于水平树状图。 我总是得到的错误是:

Error in rect.dendrogram(x, k = k, x = X$x, cluster = cluster[, k - 1],  : 
k must be between 2 and 10

请在此处找到一个可重现的简化示例:

#Install packages
install.packages(c("TraMineR","dendextend"))
#Load packages
library(TraMineR)
library(dendextend)

#Create fake dataset (each row is a sequence of characters)
a <- c(rep('A',50), rep('B',50))
seqdf <- rbind(a=a, b=sample(a), c=sample(a), d=sample(a), e=sample(a), f=sample(a),g=sample(a),h=sample(a),
i=sample(a), j=rep('A',100),k=rep('B',100),l=sample(a)) 
colnames(seqdf)<- paste(rep('a',100),c(1:100),sep='') 

#Turn it into a sequence object 
seq_def <- seqdef(seqdf, 1:100, id = rownames(seqdf), xtstep = 4)

#Calculate the dissimilarity (hamming distance) between sequences 
hd <- seqdist(seq_def, method = "HAM", with.missing = TRUE)
rows<-list(rownames(seqdf),rownames(seqdf))
dimnames(hd) <- rows
#Perform Ward clustering on dissimilarity matrix hd
ward <- hclust(as.dist(hd), method = "ward.D2")     
#Dendrogram object
dend <- as.dendrogram(ward) 

#Horizontal dendrogram 
plot(dend, horiz=TRUE)
identify(dend, horiz=TRUE) # HERE IDENTIFY GIVES AN ERROR

#Vertical dendrogram
plot(dend)
identify(dend) # this works, there is no error

希望有人知道如何解决这个问题。

最佳,

当您单击 "too close" 到屏幕边缘时,这是识别函数(例如 identify.hclust)的一般行为。如果你愿意 运行(并在树叶附近单击),你可以看到它:

plot(ward)
identify(ward, MAXCLUSTER = 12) 

我同意你的看法,这是一种有点烦人的行为(因为我们并不总能准确地点击我们想要的地方)。所以我有 added to the dendextend package a new parameter (stop_if_out),现在 identify.dendrogram 默认设置为 FALSE。这意味着当点击树状图之外太远时,该功能将不再停止。 (它适用于垂直和水平图)

我可能需要一些时间才能将此版本发布到 CRAN,但您可以使用 devtools 和 运行ning:

轻松访问它
install.packages.2 <- function (pkg) if (!require(pkg)) install.packages(pkg);
install.packages.2('devtools')
# make sure you have Rtools installed first! if not, then run:
#install.packages('installr'); install.Rtools()
devtools::install_github('talgalili/dendextend')

希望对您有所帮助。