为什么我的正则表达式无法删除一部分 fasta header
Why is my regex not working to remove a section of a fasta header
我想删除
等标题中“>”和 "Un_" 之间的所有内容
>NW_017859640.1 Esox lucius isolate CL-BC-CA-002 unplaced genomic scaffold, Eluc_V3 Un_scaffold1210
我已经尝试了多次正则表达式迭代。包含“*”的内容似乎无效
sed 's/^NC_*Eluc_V3 //'
并使用此模式
sed 's/NC_*Eluc_V3 //'
我最后想要的是
>Un_scaffold1210
试试:
sed 's/^>.*Un_/>Un_/'
在这里,我在行的开头搜索 >
,然后搜索以 Un_
结尾的内容,并将此字符串替换为 >Un_
.
寻找您告诉我们的标记似乎比您尝试猜测这些标记中应该包含什么更容易。
我想删除
等标题中“>”和 "Un_" 之间的所有内容>NW_017859640.1 Esox lucius isolate CL-BC-CA-002 unplaced genomic scaffold, Eluc_V3 Un_scaffold1210
我已经尝试了多次正则表达式迭代。包含“*”的内容似乎无效
sed 's/^NC_*Eluc_V3 //'
并使用此模式
sed 's/NC_*Eluc_V3 //'
我最后想要的是
>Un_scaffold1210
试试:
sed 's/^>.*Un_/>Un_/'
在这里,我在行的开头搜索 >
,然后搜索以 Un_
结尾的内容,并将此字符串替换为 >Un_
.
寻找您告诉我们的标记似乎比您尝试猜测这些标记中应该包含什么更容易。