如何在 R 中创建全基因组读取密度图(对于细菌基因组)

How to create a genome-wide reads density map in R (for a bacterial genome)

我有一个数据框 (pLog),其中包含针对大肠杆菌基因组 (4.6MB) 进行的芯片序列实验中每个核苷酸的读取数。我希望能够在 X 轴上绘制染色体位置,在 Y 轴上绘制读取数。为了方便起见,我将数据分箱为 100bp 的 windows。这使得数据框有 46,259 行和 2 列。一列名为 "position" 并有一个代表染色体位置的数字 (1,101,201,....),另一列名为 "values" 并包含在该 bin 上找到的读取数,例如 (210,511,315, ....)。我一直在使用 ggplot 进行所有分析,如果可能的话,我想将它用于此绘图。

我想让图表看起来像这样:

但我一直无法绘制它。

这是我的数据的样子

我试过了

ggplot(pLog,aes(position))+ 
geom_histogram(binwidth=50)
ggsave(file.jpg)

这就是它的样子:(

非常感谢!

您不能使用 geom_histogram(),请尝试 geom_line:

pLog=data.frame(position=seq(1,100000,by=100),
value=rnbinom(10000,mu=100,size=20))
ggplot(pLog,aes(x=position,y=value))+geom_line(alpha=0.7,col="steelblue")

您很可能需要尝试一下才能获得所需的可视化效果