如何将 excel 文件中的三个字母氨基酸转换为单个字母

How do i convert a three-letter amino acids to single letter in an excel file

我想将 excel 中的一列三字母氨基酸转换为一个字母,并将单字母氨基酸打印到 excel 文件中的每个相应行。我知道我可以为此使用 biopython。,

我尝试过的:

import Bio
from Bio.SeqUtils import seq1
seq1("MetAlaIleValMetGlyArgTrpLysGlyAlaArgTer")
'MAIVMGRWKGAR*'

但我想让大家明白,我不能将 python 的字符串进行转换。我需要阅读 excel 中的一整列,并打印一个包含转换后的 1 字母序列的新列。图片供参考:

示例: enter image description here

也许您可以尝试下面的脚本。您需要为所有可能的三个字母组合扩展它。希望对你有用。

# open file 
import pandas as pd
df = pd.read_excel (r'file')
df.columns=['three letter code']

codes = []
for i in df['code']:
  if i == 'uuu':
    codes.append('U')
  if i == 'cuu':
    codes.append('C')    
  if i == 'uaa':
    codes.append('A')
print (codes)
df['new_code']= codes
df

输出为:

        code    new_code
0       uuu     U
1       cuu     C
2       uaa     A