转换为二进制文件时出现 Plink 错误:.ped 文件的第 1 行的标记少于预期

Plink Error while converting to binary: Line 1 of .ped file has fewer tokens than expected

我可以得到一些帮助吗?在从 'ped'、'map' 格式转换为二进制格式 'bed'、'bim'、[=33= 时,是否有人在 plink(全基因组关联分析工具集)中遇到以下错误]?我正在使用 Linux 和 plink v1.90b3j.

Error: Line 1 of .ped file has fewer tokens than expected.

我在 python 脚本中使用这个命令来 运行 它处理几十个文件:

plink --file S205 --out S205 --make-bed

对于 32 个文件中的 2 个文件,在这种情况下,我收到此错误。该文件与所有其他文件完全一样,因为它们之前也都是使用相同的脚本完成的。所有样本的家庭、父亲、母亲 ID 和性别都相同,正如我所说,等位基因信息的写入方式与所有其他 30 个工作文件完全相同。

我注意到当我将行结束编码更改为 "Windows" 时,错误变为以下内容。其他好的文件适用于任何类型的行结尾(Unix、Win、Mac)。

Error: Line 4009 of .bim file has fewer tokens than expected.

作为示例,我将工作 *.ped (S209) 和非工作 (S204) 的第一个和最后一个 X 列留在这里。

S209 S209 0 0 1 1 C C C C T T T T ... G G G G G G 

S204 S204 0 0 1 1 T T T T G G G G ... G G G G C C 

谢谢! 丹尼尔

我发现了问题。由于碱基质量低,我的 'ped' 文件与 'map' 文件的基因型数量不完全相同。我的脚本跳过了那些 SNP,并且没有向 'ped' 输出任何内容。由于 'map' 文件是根据 GATK pileup 文件位置创建的,因此存在不匹配,因为所有位置都已转移到 'map' 文件。将其留在此处可能会有用,但可以将其标记为已解决。