如何将多fasta文件头转换为单fasta文件头?
How to convert the multi fasta file header into single fasta header?
我有一个 multifasta 文件,如下所示
>t_xth_1
MNGTGHA
>t_xth_1
MNGTGHA
>ocean
MNGTGHA
>ocean
MNGTGHA
>sea
MNGTGHA
我需要将上面的 fasta 文件转换为下面显示的文件格式(预期输出),
>t_xth_1
MNGTGHA
MNGTGHA
>ocean
MNGTGHA
MNGTGHA
>sea
MNGTGHA
请帮我做同样的事情。
谢谢。
如果awk
是一个选项
$ awk '/^>/ {if ([=10=] == prev) next; prev = [=10=]} 1' file
>t_xth_1
MNGTGHA
MNGTGHA
>ocean
MNGTGHA
MNGTGHA
>sea
MNGTGHA
在匹配正则表达式 ^>
的记录上:如果当前记录与 prev
变量相同,则转到下一条记录,否则更新 prev
。尾随 1
将 print
当前记录。
我有一个 multifasta 文件,如下所示
>t_xth_1
MNGTGHA
>t_xth_1
MNGTGHA
>ocean
MNGTGHA
>ocean
MNGTGHA
>sea
MNGTGHA
我需要将上面的 fasta 文件转换为下面显示的文件格式(预期输出),
>t_xth_1
MNGTGHA
MNGTGHA
>ocean
MNGTGHA
MNGTGHA
>sea
MNGTGHA
请帮我做同样的事情。
谢谢。
如果awk
是一个选项
$ awk '/^>/ {if ([=10=] == prev) next; prev = [=10=]} 1' file
>t_xth_1
MNGTGHA
MNGTGHA
>ocean
MNGTGHA
MNGTGHA
>sea
MNGTGHA
在匹配正则表达式 ^>
的记录上:如果当前记录与 prev
变量相同,则转到下一条记录,否则更新 prev
。尾随 1
将 print
当前记录。