在填充不同形状的图形上绘制不同颜色的选定点
Plot selected points with different colors, on graphs filled with different shapes
我目前正在尝试使用 ggplot2
绘制点图。数据分为 3 个类别,但对于每个类别,我想突出显示一些选定的点(或使它们在图中以不同方式显示)。没有像我在前面的例子中设法检查的那样的任何特殊特征(例如类别的最后一点,范围外的点,......)。
附件是我目前得到的图表的一般视图,其中每个类别都由默认形状表示。
困难在于,如何突出显示图表上的选定点,每个类别使用相同的形状,但颜色不同?所以每个点都是一样的,只是所选的点是黑色以外的颜色。我为每个类别选择了 15 个要绘制的点。
这可能与 ggplot2
相关吗?
我无法找到任何与我的情况类似的案例,而是之前的一些关于在绘图上手动分配颜色的示例。我只是想用不同的颜色而不是形状绘制类别,并使用 scale_fill_manual
以 2 种不同的颜色绘制点(所选点的基本颜色和颜色),但它不起作用,6 种颜色反而出现了。
> ggplot(gc, aes(x=Clades, y=GC, group=Genes, colour=Genes)) +
+ labs(x = "Clades", y = "GC Content (%)") +
+ ggtitle("GC Content across Clades") +
+ geom_point(size=3)+
+ scale_fill_manual(values=c("18S"="#333BFF", "ITS"="#333BFF", "rbcL"="#333BFF", "18S_C"="#CC6600", "ITS_C"="#CC6600", "rbcL_C"="#CC6600"))
如果可能的话,我还是希望它像第一张图一样,在所选点上绘制不同形状和不同颜色的点。
已更新:
这是我用作输入的制表符分隔文件的一部分:
Clades Genes GC Selected
A 18S 51.13 Y
A 18S 51.05
AA 18S 50.35
AC 18S 49.67 Y
AC 18S 49.65
C 18S 49.44
C 18S 50.06 Y
E 18S 50.06 Y
E 18S 50.18
F rbcL 41.32
F rbcL 38.87 Y
H rbcL 39.92 Y
I rbcL 39.29 Y
I rbcL 37.69
K ITS 53.55
L ITS 61.3
L ITS 60.78
L ITS 60.52
M ITS 59.97
O ITS 61.72
O ITS 60.43 Y
R ITS 50.58
R ITS 51.1
所需的输出:
所选点为黄色。
如果需要更多详细信息,请告诉我。谢谢!
为了达到您想要的结果,您可以将变量 Selected
映射到 color
并将 Genes
映射到 shape
。
作为第一步,我重新编码了 Selected
,因为我不确定它是否包含缺失字符串或空字符串。如果您不想使用颜色图例,可以添加 guides(color=FALSE)
.
gc$Selected <- ifelse(gc$Selected %in% "Y", "Y", "N")
library(ggplot2)
ggplot(gc, aes(x=Clades, y=GC, shape=Genes, colour=Selected)) +
labs(x = "Clades", y = "GC Content (%)", title = "GC Content across Clades") +
geom_point(size=3) +
scale_color_manual(values = c(Y = "yellow", N = "black"))
编辑 据我所知,没有简单的开箱即用解决方案可以将离散轴的标签放在网格线之间。实现此目的的一种选择是将分类 Clades
转换为连续变量,即数字。这将在主要网格线之外自动添加次要网格线。然后可以使用主题选项删除主要网格线:
breaks <- unique(as.numeric(factor(gc$Clades)))
labels <- unique(factor(gc$Clades))
ggplot(gc, aes(x=as.numeric(factor(Clades)), y=GC, shape=Genes, colour=Selected)) +
labs(x = "Clades", y = "GC Content (%)", title = "GC Content across Clades") +
geom_point(size=3) +
scale_x_continuous(breaks = breaks, labels = labels) +
scale_color_manual(values = c(Y = "yellow", N = "black")) +
theme(panel.grid.major.x = element_blank())
数据
text <- "Clades Genes GC Selected
A 18S 51.13 Y
A 18S 51.05 NA
AA 18S 50.35 NA
AC 18S 49.67 Y
AC 18S 49.65 NA
C 18S 49.44 NA
C 18S 50.06 Y
E 18S 50.06 Y
E 18S 50.18 NA
F rbcL 41.32 NA
F rbcL 38.87 Y
H rbcL 39.92 Y
I rbcL 39.29 Y
I rbcL 37.69 NA
K ITS 53.55 NA
L ITS 61.3 NA
L ITS 60.78 NA
L ITS 60.52 NA
M ITS 59.97 NA
O ITS 61.72 NA
O ITS 60.43 Y
R ITS 50.58 NA
R ITS 51.1 NA"
gc <- read.table(text = text, header = TRUE)
我目前正在尝试使用 ggplot2
绘制点图。数据分为 3 个类别,但对于每个类别,我想突出显示一些选定的点(或使它们在图中以不同方式显示)。没有像我在前面的例子中设法检查的那样的任何特殊特征(例如类别的最后一点,范围外的点,......)。
附件是我目前得到的图表的一般视图,其中每个类别都由默认形状表示。
困难在于,如何突出显示图表上的选定点,每个类别使用相同的形状,但颜色不同?所以每个点都是一样的,只是所选的点是黑色以外的颜色。我为每个类别选择了 15 个要绘制的点。
这可能与 ggplot2
相关吗?
我无法找到任何与我的情况类似的案例,而是之前的一些关于在绘图上手动分配颜色的示例。我只是想用不同的颜色而不是形状绘制类别,并使用 scale_fill_manual
以 2 种不同的颜色绘制点(所选点的基本颜色和颜色),但它不起作用,6 种颜色反而出现了。
> ggplot(gc, aes(x=Clades, y=GC, group=Genes, colour=Genes)) +
+ labs(x = "Clades", y = "GC Content (%)") +
+ ggtitle("GC Content across Clades") +
+ geom_point(size=3)+
+ scale_fill_manual(values=c("18S"="#333BFF", "ITS"="#333BFF", "rbcL"="#333BFF", "18S_C"="#CC6600", "ITS_C"="#CC6600", "rbcL_C"="#CC6600"))
如果可能的话,我还是希望它像第一张图一样,在所选点上绘制不同形状和不同颜色的点。
已更新:
这是我用作输入的制表符分隔文件的一部分:
Clades Genes GC Selected
A 18S 51.13 Y
A 18S 51.05
AA 18S 50.35
AC 18S 49.67 Y
AC 18S 49.65
C 18S 49.44
C 18S 50.06 Y
E 18S 50.06 Y
E 18S 50.18
F rbcL 41.32
F rbcL 38.87 Y
H rbcL 39.92 Y
I rbcL 39.29 Y
I rbcL 37.69
K ITS 53.55
L ITS 61.3
L ITS 60.78
L ITS 60.52
M ITS 59.97
O ITS 61.72
O ITS 60.43 Y
R ITS 50.58
R ITS 51.1
所需的输出:
所选点为黄色。
如果需要更多详细信息,请告诉我。谢谢!
为了达到您想要的结果,您可以将变量 Selected
映射到 color
并将 Genes
映射到 shape
。
作为第一步,我重新编码了 Selected
,因为我不确定它是否包含缺失字符串或空字符串。如果您不想使用颜色图例,可以添加 guides(color=FALSE)
.
gc$Selected <- ifelse(gc$Selected %in% "Y", "Y", "N")
library(ggplot2)
ggplot(gc, aes(x=Clades, y=GC, shape=Genes, colour=Selected)) +
labs(x = "Clades", y = "GC Content (%)", title = "GC Content across Clades") +
geom_point(size=3) +
scale_color_manual(values = c(Y = "yellow", N = "black"))
编辑 据我所知,没有简单的开箱即用解决方案可以将离散轴的标签放在网格线之间。实现此目的的一种选择是将分类 Clades
转换为连续变量,即数字。这将在主要网格线之外自动添加次要网格线。然后可以使用主题选项删除主要网格线:
breaks <- unique(as.numeric(factor(gc$Clades)))
labels <- unique(factor(gc$Clades))
ggplot(gc, aes(x=as.numeric(factor(Clades)), y=GC, shape=Genes, colour=Selected)) +
labs(x = "Clades", y = "GC Content (%)", title = "GC Content across Clades") +
geom_point(size=3) +
scale_x_continuous(breaks = breaks, labels = labels) +
scale_color_manual(values = c(Y = "yellow", N = "black")) +
theme(panel.grid.major.x = element_blank())
数据
text <- "Clades Genes GC Selected
A 18S 51.13 Y
A 18S 51.05 NA
AA 18S 50.35 NA
AC 18S 49.67 Y
AC 18S 49.65 NA
C 18S 49.44 NA
C 18S 50.06 Y
E 18S 50.06 Y
E 18S 50.18 NA
F rbcL 41.32 NA
F rbcL 38.87 Y
H rbcL 39.92 Y
I rbcL 39.29 Y
I rbcL 37.69 NA
K ITS 53.55 NA
L ITS 61.3 NA
L ITS 60.78 NA
L ITS 60.52 NA
M ITS 59.97 NA
O ITS 61.72 NA
O ITS 60.43 Y
R ITS 50.58 NA
R ITS 51.1 NA"
gc <- read.table(text = text, header = TRUE)