在生物信息学中,什么是单例?
In bioinformatics, what is a singleton?
我很快意识到生物信息学并不是一门术语定义明确且易于理解的学科。我的一些结果有明显的差异。
我在几个 BAM 文件上使用了 samtools view -b -h -f 8 fileName.bam > mateUnmapped.bam
。我的印象是该命令仅提取其伙伴与基因组草图不一致的读数(还包括 header;输出为 BAM 格式)
当我对生成的文件使用 samtools 'flagstat'
时,我得到了一个有趣的结果:'singletons' 的数量与读取总数不匹配......这对我来说似乎很奇怪。
我能找到的唯一和解是在这里:
http://seqanswers.com/forums/showthread.php?t=46711
一个人在回答这个论坛中提出的问题时声称,单例有时被定义为根本没有伙伴读取的序列。但是,这仍然不能解释我的结果。 Flagstat 说我的阅读中大约有 40% 是单例,但我觉得根据我使用的 'view' 命令,它们应该都是单例。
经验丰富的生物信息学家可以帮助我吗?
在一般基因组组装中,单子是未 assemble 到重叠群或映射到参考的读取。它是只有 1 个读取的重叠群。
在 samtools 中,单例指的是已映射但伴侣未映射的读取。
Flagstat says about 40% of my reads are singletons, but I feel like
based on the 'view' command I used, they should ALL be singletons.
我不是 samtools 专家,但我认为 -f 8
的意思是显示其伙伴未映射的读数。这并没有说明阅读本身,只是它的伴侣。因此,您可能会得到两个完全没有映射的伙伴 (60%) 和只有一个伙伴映射 (40%) 的读数。 ?
您可能想尝试 运行 -f 8 -F 4
进行映射但其伙伴未映射的读数。
我很快意识到生物信息学并不是一门术语定义明确且易于理解的学科。我的一些结果有明显的差异。
我在几个 BAM 文件上使用了 samtools view -b -h -f 8 fileName.bam > mateUnmapped.bam
。我的印象是该命令仅提取其伙伴与基因组草图不一致的读数(还包括 header;输出为 BAM 格式)
当我对生成的文件使用 samtools 'flagstat'
时,我得到了一个有趣的结果:'singletons' 的数量与读取总数不匹配......这对我来说似乎很奇怪。
我能找到的唯一和解是在这里:
http://seqanswers.com/forums/showthread.php?t=46711
一个人在回答这个论坛中提出的问题时声称,单例有时被定义为根本没有伙伴读取的序列。但是,这仍然不能解释我的结果。 Flagstat 说我的阅读中大约有 40% 是单例,但我觉得根据我使用的 'view' 命令,它们应该都是单例。
经验丰富的生物信息学家可以帮助我吗?
在一般基因组组装中,单子是未 assemble 到重叠群或映射到参考的读取。它是只有 1 个读取的重叠群。
在 samtools 中,单例指的是已映射但伴侣未映射的读取。
Flagstat says about 40% of my reads are singletons, but I feel like based on the 'view' command I used, they should ALL be singletons.
我不是 samtools 专家,但我认为 -f 8
的意思是显示其伙伴未映射的读数。这并没有说明阅读本身,只是它的伴侣。因此,您可能会得到两个完全没有映射的伙伴 (60%) 和只有一个伙伴映射 (40%) 的读数。 ?
您可能想尝试 运行 -f 8 -F 4
进行映射但其伙伴未映射的读数。