为什么我的正则表达式无法删除一部分 fasta header

Question

我想删除

等标题中“>”和 "Un_" 之间的所有内容

>NW_017859640.1 Esox lucius isolate CL-BC-CA-002 unplaced genomic scaffold, Eluc_V3 Un_scaffold1210

我已经尝试了多次正则表达式迭代。包含“*”的内容似乎无效

sed 's/^NC_*Eluc_V3 //'

并使用此模式

sed 's/NC_*Eluc_V3 //'

我最后想要的是

>Un_scaffold1210

Answer 1

试试：

sed 's/^>.*Un_/>Un_/'

在这里，我在行的开头搜索 >，然后搜索以 Un_ 结尾的内容，并将此字符串替换为 >Un_.

寻找您告诉我们的标记似乎比您尝试猜测这些标记中应该包含什么更容易。

Why is my regex not working to remove a section of a fasta header