使用 bcftools 从 vcf 创建每个样本 table

creating a per sample table from a vcf using bcftools

我有一个多样本 vcf 文件,我想在左列中获取 table 个 ID,其中包含其中包含备用等位基因的变体。它应该如下所示:

ID1 chr2:87432:A:T_0/1 chr10:43234:C:G_1/1
ID2 chr2:87432_A:T_1/1 
ID3 chr11:432434:T:G chr14:34234234:C:G chr20:34324234:T:C

这是为了再读入R

我试过以下组合:

bcftools query -f '[%SAMPLE\t] %CHROM:%POS:%REF:%ALT[%GT]\n' 但我不断收到样本 ID 在同一行上重叠,我不太明白语法。

非常感谢您的帮助

您无法通过单个 BCFtools 命令实现您想要的效果。 BCFtools 一次解析一个 VCF 变体。但是,您可以使用这样的命令来提取您想要的内容:

bcftools +split -i 'GT="0/1" | GT="1/1"' -Ob -o DIR input.vcf

这将为每个样本创建一个小的 .bcf 文件,然后您可以 运行 bcftools 查询的多个实例来获得您想要的结果