使用 biopython 从输出文件中的 fasta 文件标题打印物种名称(对于多个文件)

Printing species name from fasta file heading in an output file using biopython (for multiple files)

我无法从我的 fasta 文件中打印物种名称

输入文件是这样的:

>NP_842573.1 chromosomal replication initiator DnaA [Bacillus anthracis str. Ames]
MENISDLWNSALKELEKKVSKPSYETWLKSTTAHNLKKDVLTITAPNEFARDWLESHYSELISETLYDLTGAKLAIRFIIPQSQAEEEIDLPPAKPNAAQDDSNHLPQSMLNPKYTFDTFVIGSGNRFAHAASLAVAEAPAKAYNPLFIYGGVGLGKTHLMHAIGHYVIEHNPNAKVVYLSSEKFTNEFINSIRDNKAVDFRNKYRNVDVLLIDDIQFLAGKEQTQEEFFHTFNALHEESKQIVISSDRPPKEIPTLEDRLRSRFEWGLITDITPPDLETRIAILRKKAKAEGLDIPNEVMLYIANQIDSNIRELEGALIRVVAYSSLINKDINADLAAEALKDIIPNSKPKIISIYDIQKAVGDVYQVKLEDFKAKKRTKSVAFPRQIAMYLSRELTDSSLPKIGEEFGGRDHTTVIHAHEKISKLLKTDTQLQKQVEEINDILK

我的输出文件的一部分如下所示(GCF...faa 是文件名)

Y,2.798738459583378,GCF_000014005.1_ASM1400v1_protein.faa

我真的很想打印物种名称 [Bacillus anthracis str. Ames] 以及文件名。

我需要编辑的行是:

file.write ('\nY,' + str(pY) +  ',' + str(FILE))

打印几个变量,然后打印文件名字符串。

但我正在努力寻找一种使用 biopython 在 fasta 文件的 header 中输出方括号之间的字符串的方法。

正如评论中Chris_Rands指出的那样,答案是:

 record.description.split('[', 1)[1].split(']', 1)[0]