一起使用 bwa mem 和 umitools
Using bwa mem and umitools together
我正在尝试使用 bwa mem 将序列读取与 hg19 参考比对,但我的序列都有一个 UMI(唯一分子标识符)。我像这样使用 umitools:
umitools trim --end 5 input.fastq NNNNNN > output.fastq
然后将我的 UMI 序列正确地附加到 output.fastq 文件中的名称行,但是当使用 bwa mem 对齐时,我得到的错误是:
paired reads have different names: "someTitle:UMI_ATGCTC", "someTitle:UMI_CATTAT"
有没有办法同时使用 bwa mem 和 umitools 来避免这种情况发生?
所以这并没有完全回答问题,但已经很接近了。 umitools 不适用于配对的末端读取。我为解决这个问题所做的是 trim 关闭我的 UMI 序列(读取的每一侧 6bp),然后使用以下代码对齐:
sed -i~ '2~4s/^.\{6\}//' file
地址2~4
表示"start on line 2, repeat each 4 lines"。
s
表示替换,^
匹配行首,.
匹配任意字符,\{6\}
指定长度(一个"quantifier")。替换字符串为空 (//
).
-i~
替换原文件,留下文件名附加 ~
的备份。
我正在尝试使用 bwa mem 将序列读取与 hg19 参考比对,但我的序列都有一个 UMI(唯一分子标识符)。我像这样使用 umitools:
umitools trim --end 5 input.fastq NNNNNN > output.fastq
然后将我的 UMI 序列正确地附加到 output.fastq 文件中的名称行,但是当使用 bwa mem 对齐时,我得到的错误是:
paired reads have different names: "someTitle:UMI_ATGCTC", "someTitle:UMI_CATTAT"
有没有办法同时使用 bwa mem 和 umitools 来避免这种情况发生?
所以这并没有完全回答问题,但已经很接近了。 umitools 不适用于配对的末端读取。我为解决这个问题所做的是 trim 关闭我的 UMI 序列(读取的每一侧 6bp),然后使用以下代码对齐:
sed -i~ '2~4s/^.\{6\}//' file
地址2~4
表示"start on line 2, repeat each 4 lines"。
s
表示替换,^
匹配行首,.
匹配任意字符,\{6\}
指定长度(一个"quantifier")。替换字符串为空 (//
).
-i~
替换原文件,留下文件名附加 ~
的备份。