如何使用 OmicCircos 或其他类似工具表示序列数据的物理图谱和连锁图谱之间的关系

How to represent a relationship between physical map and linkage map of a sequenced data using OmicCircos or another similar

我们想做一个图表来显示链接图和使用 Circos 可视化的物理图之间的同线链接

source("http://bioconductor.org/biocLite.R")
biocLite("OmicCircos")

每条线将代表我们的连锁图中特定标记的位置(黑色;以 cM 为单位)和物理图中的同源序列(各种颜色;以 Mb 为单位)之间的连接。这个想法是做这样的图片:

G3(贝塞斯达)。 2015 年 2 月; 5(2): 241–251。 2014 年 12 月 17 日在线发布。doi: 10.1534/g3.114.015438

我有一个结构化的家庭(亲本、F1 和 F2),已根据参考基因组进行测序和比对。我使用 r/onemap (CRAN) 做了一个连锁图谱来检查 F2 家族中标记的重组分数(仅具有孟德尔遗传的标记)。现在我有通过这种格式的重组获得的组:

> maps
[[7]]

Printing map:

Markers                    Position           Parent 1       Parent 2

4142 MS33_8248325              0.00           a |  | b       a |  | a 
4143 MS33_8248326              0.10           a |  | b       a |  | a 
4144 MS33_8248327              0.20           a |  | b       a |  | a 
4145 MS33_8248328              0.30           a |  | b       a |  | a 
4146 MS33_8248329              0.40           a |  | b       a |  | a 
4147 MS33_8248330              0.50           a |  | b       a |  | a 

6 markers            log-likelihood: -49.90696 

MS33_8248325 表示我们在第二列中有染色体 (M33) 和位置 (chr 中的 8248325) 信息和 cM 位置的标记。

地图文件包含:

$seq.num
$seq.phases
$seq.rf
$seq.like
$data.nam
$twopt

每个连锁群

如何显示联动图和实物图的对比来证明它们是一致的?? 看起来 "OmicCircos" 是个好主意,但我找不到教程来生成像这里展示的这样的图,它分为两侧(右:染色体,左:连锁群)。

我正在使用 OmicCircos 教程证明的脚本: 尝试编辑此命令行并从我的数据中获取适当的输入。

library (OmicCircos)


options (stringsAsFactors=FALSE) ;
set.seed(1234) ;

 # initial
seg.num <-10
ind.num <-20
seg.po<- c(20:50)
link.num <- 10
link.pg.num <-4

sim.out<- sim.circos (seg=seg.num, po=seg.po, ind=ind.num, link=link.num, link.pg=link.pg.num)


seg.f<-sim.out$seg.frame
seg.v<-sim.out$seg.mapping
link.v<-sim.out$seg.link
link.pg.v<-sim.out$seg.link.pg
seg.num<-length(unique(seg.f[,1]))

#namesegment(option)
seg.name<-paste("chr",1:seg.num,sep="")
db<-segAnglePo(seg.f,seg=seg.name)
#settransparentcolors
colors<-rainbow(seg.num,alpha=0.5)

#Togetperfectcircle,theoutputfigureshouldbeinsquare.Theoutputfileisthesamewidthandheight.
#Thesamelinevaluesareinthemarginofthegraphicalparameters.

par(mar=c(2,2,2,2));
plot(c(1,800),c(1,800),type="n",axes=FALSE,xlab="",ylab="",main="")
circos(R=400,cir=db,type="chr",col=colors,print.chr.lab=TRUE,W=4,scale=TRUE)
circos(R=360,cir=db,W=40,mapping=seg.v,col.v=3,type="l",B=TRUE,col=colors[1],lwd=2,scale=TRUE)
circos(R=320,cir=db,W=40,mapping=seg.v,col.v=3,type="ls",B=FALSE,col=colors[9],lwd=2,scale=TRUE)
circos(R=280,cir=db,W=40,mapping=seg.v,col.v=3,type="lh",B=TRUE,col=colors[7],lwd=2,scale=TRUE)
circos(R=240,cir=db,W=40,mapping=seg.v,col.v=19,type="ml",B=FALSE,col=colors,lwd=2,scale=TRUE)
circos(R=200,cir=db,W=40,mapping=seg.v,col.v=19,type="ml2",B=TRUE,col=colors, lwd=2)
circos(R=160,cir=db,W=40,mapping=seg.v,col.v=19,type="ml3",B=FALSE,cutoff=5, lwd=2)
circos(R=150,cir=db,W=40,mapping=link.v,type="link",lwd=2,col=colors[c(1,7)])
circos(R=150,cir=db,W=40,mapping=link.pg.v,type="link.pg",lwd=2,col=sample(colors,link.pg.num))

dev.off()
#graphics.off()

按照link解决这个技巧 https://support.bioconductor.org/p/80024/#80129

总结:

library (OmicCircos)
options(stringsAsFactors = FALSE) 
set.seed(1234)

################################################
Chr1   <- rep(paste0("Chr", 1), each=518);
Chr2   <- rep(paste0("Chr", 2), each=362);
Chr3   <- rep(paste0("Chr", 3), each=347);
Chr4   <- rep(paste0("Chr", 4), each=366);
...
seg1   <- c(Chr1, Chr2, Chr3, Chr4, ...);

repChr1<-rep(1:518);
repChr2<-rep(1:362);
repChr3<-rep(1:347);
repChr4<-rep(1:366);
...
end1    <- c(repChr1, repChr2, repChr3, repChr4, ...);
LG1   <- rep(paste0("LG", 1), each=528);
LG2   <- rep(paste0("LG", 2), each=354);
LG3   <- rep(paste0("LG", 3), each=346);
LG4   <- rep(paste0("LG", 4), each=367);
...
seg2   <- c(LG1, LG2, LG3, LG4, ...);
end2    <- c(repLG1, repLG2, repLG3, repLG4, ...)

end   <- c(end1, end2);
segs   <- c(seg1, seg2);
start  <- end - 1;

seg.f <- data.frame(seg.name=segs, seg.Start=start, seg.End=end, the.v=runif(length(end)), Note=sample(LETTERS, length(end), rep=T));
db    <- segAnglePo(seg.f,seg=unique(segs));
## colors
col1  <- rainbow(4+...);
col2  <- rainbow(4+..., alpha=0.3);
chr.c <- c(col1, rep("black", 4+...));

## links - simulation
#link.num <- 100;
#link.i   <- sample(1:length(seg1), link.num, rep=T);
#LG1      <- length(seg1) + 1;
#link.j   <- sample(LG1:length(end), link.num, rep=T);
#link.df  <- cbind(seg.f[link.i,c(1,2,5)], seg.f[link.j,c(1,2,5)]);
#link.n   <- gsub("Chr", "", link.df[,1]);
#link.c   <- col2[as.numeric(link.n)]

pdf("syntenyGBS.pdf", 8, 8);
par(mar=c(2,2,2,2));
plot(c(1,800),c(1,800),type="n",axes=FALSE,xlab="",ylab="",main="")
circos(R=360, cir=db, type="chr",col=chr.c, print.chr.lab=TRUE, W=40, scale=F)
circos(R=350, cir=db, W=40, mapping=link.df, type="link", lwd=0.1, col=link.c);

dev.off();