本地爆炸的长度选项
length option for local blast
我有一个比较大的 blastn 输出文件。由于没有指定查询序列的最小核苷酸长度的选项,我的想法是在 blast 运行 之后使用 awk 搜索它。
文件示例如下:
> abc
Length=4553119
Score = 273 bits (302), Expect = 3e-74
Identities = 151/151 (100%), Gaps = 0/151 (0%)
Strand=Plus/Plus
Query 1 CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 4297151 CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC 4297210
Query 61 TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 4297211 TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC 4297270
Query 121 TGCTGCGCGGAGGCCCCCGGGTACTGCACCA 151
|||||||||||||||||||||||||||||||
Sbjct 4297271 TGCTGCGCGGAGGCCCCCGGGTACTGCACCA 4297301
Score = 28.3 bits (30), Expect = 1.7
Identities = 15/15 (100%), Gaps = 0/15 (0%)
Strand=Plus/Minus
Query 97 GGCTGCATCGCCAGG 111
|||||||||||||||
Sbjct 63261 GGCTGCATCGCCAGG 63247
使用 awk,我正在搜索包含 Identities = [>=50]
的所有行
awk 'Identities = >= 50'
我不关心该行的其余部分(从 /151 (100%)
开始)。
但是我遇到了语法错误,那么如何将 "greater and equal than" 放在那里呢?
$ awk '/Identities =/ && (+0)>=50' file
Identities = 151/151 (100%), Gaps = 0/151 (0%)
我有一个比较大的 blastn 输出文件。由于没有指定查询序列的最小核苷酸长度的选项,我的想法是在 blast 运行 之后使用 awk 搜索它。
文件示例如下:
> abc
Length=4553119
Score = 273 bits (302), Expect = 3e-74
Identities = 151/151 (100%), Gaps = 0/151 (0%)
Strand=Plus/Plus
Query 1 CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 4297151 CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC 4297210
Query 61 TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 4297211 TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC 4297270
Query 121 TGCTGCGCGGAGGCCCCCGGGTACTGCACCA 151
|||||||||||||||||||||||||||||||
Sbjct 4297271 TGCTGCGCGGAGGCCCCCGGGTACTGCACCA 4297301
Score = 28.3 bits (30), Expect = 1.7
Identities = 15/15 (100%), Gaps = 0/15 (0%)
Strand=Plus/Minus
Query 97 GGCTGCATCGCCAGG 111
|||||||||||||||
Sbjct 63261 GGCTGCATCGCCAGG 63247
使用 awk,我正在搜索包含 Identities = [>=50]
awk 'Identities = >= 50'
我不关心该行的其余部分(从 /151 (100%)
开始)。
但是我遇到了语法错误,那么如何将 "greater and equal than" 放在那里呢?
$ awk '/Identities =/ && (+0)>=50' file
Identities = 151/151 (100%), Gaps = 0/151 (0%)