通过 plink 1.9 及其变体名称将 vcf 中的多等位基因拆分为双等位基因

Split multiallelic to biallelic in vcf by plink 1.9 and its variant name

我正在尝试使用 plink1.9 将多等位基因拆分为双等位基因。输入是

1       chr1:930939:G:A 0       930939  G       A
1       chr1:930947:G:A 0       930947  A       G
1       chr1:930952:G:A;chr1:930952:G:C 0       930952  A       G

它所做的是:

1       chr1:930939:G:A 0       930939  G       A
1       chr1:930947:G:A 0       930947  A       G
1       chr1:930952:G:A;chr1:930952:G:C 0       930952  A       G
1       chr1:930952:G:A;chr1:930952:G:C 0       930952  A       G

我期望的是:

1       chr1:930939:G:A 0       930939  G       A
1       chr1:930947:G:A 0       930947  A       G
1       chr1:930952:G:A 0       930952  A       G
1       chr1:930952:G:C 0       930952  A       G

请帮我制作一个符合我期望的vcf 或ped 或map 文件。 谢谢。

我用bcftools完成了任务。

https://github.com/samtools/bcftools/issues/1193