UpSetR 中的堆积条形图

Question

我一直在寻找一种在 upsetR 图中绘制堆积条形图的方法。我下载了电影数据集（来自 here）并添加了一个只有两个值 "M" 和 "C" 的列。下面是有关我如何加载数据和添加 "x" 列的信息。

编辑：

m <- read.csv(system.file("extdata", "movies.csv", package = "UpSetR"), 
                           header = T, sep = ";")
nrow(m)
[1] 3883
x<-c(rep("M", 3000), rep("C", 883))
m<-cbind(m, x)  
unique(m$x)
[1] M C

这是数据框的结构：

str(m)
'data.frame':   3883 obs. of  22 variables:
 $ Name       : Factor w/ 3883 levels ",000,000 Duck (1971)",..: 3577 1858 1483 3718 1175 1559 3010 3548 3363 1420 ...
 $ ReleaseDate: int  1995 1995 1995 1995 1995 1995 1995 1995 1995 1995 ...
 $ Action     : int  0 0 0 0 0 1 0 0 1 1 ...
 $ Adventure  : int  0 1 0 0 0 0 0 1 0 1 ...
 $ Children   : int  1 1 0 0 0 0 0 1 0 0 ...
 $ Comedy     : int  1 0 1 1 1 0 1 0 0 0 ...
 $ Crime      : int  0 0 0 0 0 1 0 0 0 0 ...
 $ Documentary: int  0 0 0 0 0 0 0 0 0 0 ...
 $ Drama      : int  0 0 0 1 0 0 0 0 0 0 ...
 $ Fantasy    : int  0 1 0 0 0 0 0 0 0 0 ...
 $ Noir       : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Horror     : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Musical    : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Mystery    : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Romance    : int  0 0 1 0 0 0 1 0 0 0 ...
 $ SciFi      : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Thriller   : int  0 0 0 0 0 1 0 0 0 1 ...
 $ War        : int  0 0 0 0 0 0 0 0 0 0 ...
 $ Western    : int  0 0 0 0 0 0 0 0 0 0 ...
 $ AvgRating  : num  4.15 3.2 3.02 2.73 3.01 3.88 3.41 3.01 2.66 3.54 ...
 $ Watches    : int  2077 701 478 170 296 940 458 68 102 888 ...
 $ x          : Factor w/ 2 levels "M","C": 1 1 1 1 1 1 1 1 1 1 ...

现在我尝试按如下方式实现堆积条形图：

upset(m,
  queries = list(
    list(query = elements, 
         params = list("x", "M"), color = "#e69f00", active = T),
    list(query = elements, 
         params = list("x", "C"), color = "#cc79a7", active = T)))

结果如下所示：

如您所见，比例是错误的，因为每个条形中应该只有两种颜色（因子）"M" 或 "C"。正如 here 也指出的那样，这个问题似乎不是一个微不足道的问题。有没有人知道如何在 UpsetR 中实现这个？非常感谢

Answer 1

我遇到了类似的问题并找到了解决方法：

library("UpSetR")
m <- read.csv(system.file("extdata", "movies.csv", package = "UpSetR"), 
              header = T, sep = ";")
x<-c(rep("M", 2000), rep("Q", 1000), rep("C", 883))
m<-cbind(m, x)  

upset(m,
      queries = list(
        list(query = elements, 
             params = list("x", c("M","Q", "C")), color = "#e69f00", active = T),
        list(query = elements, 
             params = list("x", c("Q","C")), color = "#cc79a7", active = T),
        list(query = elements, 
             params = list("x", "C"), color = grey(0.7), active = T)))

原始示例中的问题是每个查询分别覆盖总条并从 y=0 开始。因此，条形图剩余的黑色部分始终与底部的紫色部分具有完全相同的高度。解决方法是系统地添加变量可以采用的不同值的组合查询：

从查询和所有可能值组合的相应颜色开始（此处 c("M","Q","C") 作为 params = list() 的第二个参数）。
连续省略一个可能的值（例如此处第一步中的c("Q","C")）。遗漏的值将由查询的颜色表示，最后一个仍然包含它（本例中为 "M"）。
继续添加查询，直到 params = list().

应该可以通过编程方式为更多的可能值执行此操作并提供一些调色板。但这仍然是一种解决方法，并且最好有一个堆叠查询的本机实现——所以如果你想看到这个功能，你可以考虑提高 respective issue over at the Github repo.

Answer 2

在 @dlaehnemann 的精彩回答下方，但为了使用循环创建该列表列表以及将所需颜色链接到它而进行了一些修改。

m <- read.csv(system.file("extdata", "movies.csv", package = "UpSetR"), header = T, sep = ";")
x<-c(rep("M", 2000), rep("Q", 1000), rep("C", 883))
m<-cbind(m, x)

i<-0
mylist<-list()
vectorUniqueValue <- unique(m$x)
colors = colorRampPalette(c("#332288",'#fdff00','#FF0000',"#CC6677","#88CCEE",'#36870c','#b786d2','#7c3c06',"#DDCC77",'#192194','#52cff4','#4f9c8b',"#4477AA",'#808080'))(length(vectorUniqueValue))
while ( length(vectorUniqueValue)>0 ){
  i<-i+1
  mylist[[i]]<-list(query = elements, params = list("x",as.character(vectorUniqueValue)), color = colors[i], active = T)
  vectorUniqueValue<-vectorUniqueValue[-1]
}
upset(m, queries = mylist)

希望它能有所帮助，直到有一天有人在 github 上解决这个问题！

Answer 3

这是一种使用堆叠条形图创建翻转图的方法，但使用的是我的 ComplexUpset 而不是 UpSetR：

library(ComplexUpset)
movies = as.data.frame(ggplot2movies::movies)
genres = colnames(movies)[18:24]

# for simplicity of examples, only use the complete data points
movies[movies$mpaa == '', 'mpaa'] = NA
movies = na.omit(movies)


upset(
    movies,
    genres,
    base_annotations=list(
        'Intersection size'=intersection_size(
            counts=FALSE,
            mapping=aes(fill=mpaa)
        )
    ),
    width_ratio=0.1
)

请参阅 documentation 中的更多示例。安装说明可在 GitHub: krassowski/complex-upset（也有与 UpSetR 和其他软件包的比较）。

UpSetR 中的堆积条形图

Stacked barplot in UpSetR

dataview

r

data-visualization

dataframe

upsetr