使用 biopython 从输出文件中的 fasta 文件标题打印物种名称（对于多个文件）

Question

我无法从我的 fasta 文件中打印物种名称

输入文件是这样的：

>NP_842573.1 chromosomal replication initiator DnaA [Bacillus anthracis str. Ames]
MENISDLWNSALKELEKKVSKPSYETWLKSTTAHNLKKDVLTITAPNEFARDWLESHYSELISETLYDLTGAKLAIRFIIPQSQAEEEIDLPPAKPNAAQDDSNHLPQSMLNPKYTFDTFVIGSGNRFAHAASLAVAEAPAKAYNPLFIYGGVGLGKTHLMHAIGHYVIEHNPNAKVVYLSSEKFTNEFINSIRDNKAVDFRNKYRNVDVLLIDDIQFLAGKEQTQEEFFHTFNALHEESKQIVISSDRPPKEIPTLEDRLRSRFEWGLITDITPPDLETRIAILRKKAKAEGLDIPNEVMLYIANQIDSNIRELEGALIRVVAYSSLINKDINADLAAEALKDIIPNSKPKIISIYDIQKAVGDVYQVKLEDFKAKKRTKSVAFPRQIAMYLSRELTDSSLPKIGEEFGGRDHTTVIHAHEKISKLLKTDTQLQKQVEEINDILK

我的输出文件的一部分如下所示（GCF...faa 是文件名）

Y,2.798738459583378,GCF_000014005.1_ASM1400v1_protein.faa

我真的很想打印物种名称 [Bacillus anthracis str. Ames] 以及文件名。

我需要编辑的行是：

file.write ('\nY,' + str(pY) +  ',' + str(FILE))

打印几个变量，然后打印文件名字符串。

但我正在努力寻找一种使用 biopython 在 fasta 文件的 header 中输出方括号之间的字符串的方法。

Answer 1

正如评论中Chris_Rands指出的那样，答案是：

 record.description.split('[', 1)[1].split(']', 1)[0]

使用 biopython 从输出文件中的 fasta 文件标题打印物种名称（对于多个文件）

Printing species name from fasta file heading in an output file using biopython (for multiple files)

python

biopython