通过在 fasta 文件中添加 "pipe" 来编辑 header

Editing header by adding "pipe" in fasta file

我想通过添加管道在 fasta 文件中编辑我的 headers 但无法这样做。 header 看起来像这样

KX035646.1 Name:NADH domain ATGCGGGGCTGC..

我想要它

sp|KX035646.1| Name:NADH domain

所有序列的入藏号都不同 你能帮我做吗?谢谢

你可以试试简单的 sed one liner:

cat test.fasta
>KX035646.1 Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>KX035646.2 Name:NADH domain ATGCGGGGCTGC..43214
GCAT

sed 's/^>\([a-zA-Z0-9.]\+\)\(.*\)/>sp||/' test.fasta
>sp|KX035646.1| Name:NADH domain ATGCGGGGCTGC..
ACGT
CTTT
>sp|KX035646.2| Name:NADH domain ATGCGGGGCTGC..43214
GCAT