基于数据框中列的树状图的颜色分支

Color branches of a dendrogram based on column in dataframe

我想根据 hclust 函数中使用的数据框的列中的值为树状图的分​​支着色。

在您将此问题标记为重复之前 question, which links to this question。请注意,这实际上从未在答案中得到充分解决。根据树状图的拓扑结构为分支着色很容易,但我无法弄清楚如何根据 hclust 函数中使用的数据框中的列为分支着色。

我尝试过以两种非常相似的方式使用 dendextend 包:

library(dendextend)
par(mar = c(2,1,0,8)) #make sure the whole plot is on the page
hc <- hclust(dist(mtcars)) #cluster dataframe based on distance
dend <- as.dendrogram(hc) #use dendextend to create dendrogram
dend2 <- color_branches(dend, col = mtcars$cyl) #attempt but fail at coloring branches
plot (dend2, horiz = TRUE) #plot dendrogram

dend3 <- assign_values_to_leaves_edgePar(dend, value = mtcars$cyl, edgePar = "col") #attempt but fail at coloring branches
plot (dend3, horiz = TRUE) #plot dendrogram

factor(mtcars$cyl替换mtcars$cyl也没有解决问题。

这两种解决方案都会生成未正确着色的树状图。 看起来它是根据 cyl 列中值的顺序从树状图的底部到顶部对颜色进行排序,但由于分支不再按该顺序排列,因此着色没有任何意义。我宁愿不对数据帧进行排序来解决这个问题。

谢谢。

您需要按照树状图的叶子顺序排列颜色。您可以使用labels()提取叶子上使用的名称

dend2 <- color_branches(dend, col=mtcars[labels(dend),"cyl"])