绘制染色体上不同 SNP 的等位基因频率的好方法
Good way to graph allele frequency of different SNPs along chromosomes
我有一组来自基因组不同部分的 SNP 及其在不同人群和感兴趣的集合种群中的等位基因频率。我想沿着所有 22 个常染色体的 SNP 基因组坐标绘制等位基因频率。
基本上,我想从 Sankararaman 等人那里生成类似图 1A 的内容。 (2014) (http://www.nature.com/nature/journal/v507/n7492/fig_tab/nature12961_F1.html) 除了 Y 轴是频率,所有群体都在同一张图上(不分开),我会用彩色点代替尖峰。
我的数据是这样格式化的(MAF = 次要等位基因频率,这就是我想要绘制的图形)
CHR SNP COORD CLST A1 A2 MAF MAC NCHROBS
1 rs### 2#### Region G A 0.4 400 1000
(它检查一个区域的所有 SNP,然后检查下一个区域的 SNP,依此类推)
关于如何在 R 中执行此操作的任何建议?谢谢!
这里有一个简单的坐标与频率关系图:
#Example data:
MAF=runif(1000,min=0,max=1)
COORD=runif(1000,min=0,max=100000)
test.df=data.frame(COORD,MAF)
#plot
plot(test.df$COORD,test.df$MAF)
在图中您不需要示例数据,但需要用您的 table 名称代替 test.df
。
如果需要美化colors/labels等也可以:
plot(test.df$COORD,test.df$MAF, col="red", pch=18)
或
library(ggplot2)
p=ggplot(test.df,aes(COORD,MAF))
p + geom_point()
我有一组来自基因组不同部分的 SNP 及其在不同人群和感兴趣的集合种群中的等位基因频率。我想沿着所有 22 个常染色体的 SNP 基因组坐标绘制等位基因频率。
基本上,我想从 Sankararaman 等人那里生成类似图 1A 的内容。 (2014) (http://www.nature.com/nature/journal/v507/n7492/fig_tab/nature12961_F1.html) 除了 Y 轴是频率,所有群体都在同一张图上(不分开),我会用彩色点代替尖峰。
我的数据是这样格式化的(MAF = 次要等位基因频率,这就是我想要绘制的图形)
CHR SNP COORD CLST A1 A2 MAF MAC NCHROBS
1 rs### 2#### Region G A 0.4 400 1000
(它检查一个区域的所有 SNP,然后检查下一个区域的 SNP,依此类推)
关于如何在 R 中执行此操作的任何建议?谢谢!
这里有一个简单的坐标与频率关系图:
#Example data:
MAF=runif(1000,min=0,max=1)
COORD=runif(1000,min=0,max=100000)
test.df=data.frame(COORD,MAF)
#plot
plot(test.df$COORD,test.df$MAF)
在图中您不需要示例数据,但需要用您的 table 名称代替 test.df
。
如果需要美化colors/labels等也可以:
plot(test.df$COORD,test.df$MAF, col="red", pch=18)
或
library(ggplot2)
p=ggplot(test.df,aes(COORD,MAF))
p + geom_point()