如何在 R 中创建全基因组读取密度图(对于细菌基因组)
How to create a genome-wide reads density map in R (for a bacterial genome)
我有一个数据框 (pLog),其中包含针对大肠杆菌基因组 (4.6MB) 进行的芯片序列实验中每个核苷酸的读取数。我希望能够在 X 轴上绘制染色体位置,在 Y 轴上绘制读取数。为了方便起见,我将数据分箱为 100bp 的 windows。这使得数据框有 46,259 行和 2 列。一列名为 "position" 并有一个代表染色体位置的数字 (1,101,201,....),另一列名为 "values" 并包含在该 bin 上找到的读取数,例如 (210,511,315, ....)。我一直在使用 ggplot 进行所有分析,如果可能的话,我想将它用于此绘图。
我想让图表看起来像这样:
但我一直无法绘制它。
这是我的数据的样子
我试过了
ggplot(pLog,aes(position))+
geom_histogram(binwidth=50)
ggsave(file.jpg)
这就是它的样子:(
非常感谢!
您不能使用 geom_histogram(),请尝试 geom_line:
pLog=data.frame(position=seq(1,100000,by=100),
value=rnbinom(10000,mu=100,size=20))
ggplot(pLog,aes(x=position,y=value))+geom_line(alpha=0.7,col="steelblue")
您很可能需要尝试一下才能获得所需的可视化效果
我有一个数据框 (pLog),其中包含针对大肠杆菌基因组 (4.6MB) 进行的芯片序列实验中每个核苷酸的读取数。我希望能够在 X 轴上绘制染色体位置,在 Y 轴上绘制读取数。为了方便起见,我将数据分箱为 100bp 的 windows。这使得数据框有 46,259 行和 2 列。一列名为 "position" 并有一个代表染色体位置的数字 (1,101,201,....),另一列名为 "values" 并包含在该 bin 上找到的读取数,例如 (210,511,315, ....)。我一直在使用 ggplot 进行所有分析,如果可能的话,我想将它用于此绘图。
我想让图表看起来像这样:
但我一直无法绘制它。
这是我的数据的样子
我试过了
ggplot(pLog,aes(position))+
geom_histogram(binwidth=50)
ggsave(file.jpg)
这就是它的样子:(
非常感谢!
您不能使用 geom_histogram(),请尝试 geom_line:
pLog=data.frame(position=seq(1,100000,by=100),
value=rnbinom(10000,mu=100,size=20))
ggplot(pLog,aes(x=position,y=value))+geom_line(alpha=0.7,col="steelblue")
您很可能需要尝试一下才能获得所需的可视化效果