如何将 excel 文件中的三个字母氨基酸转换为单个字母
How do i convert a three-letter amino acids to single letter in an excel file
我想将 excel 中的一列三字母氨基酸转换为一个字母,并将单字母氨基酸打印到 excel 文件中的每个相应行。我知道我可以为此使用 biopython。,
我尝试过的:
import Bio
from Bio.SeqUtils import seq1
seq1("MetAlaIleValMetGlyArgTrpLysGlyAlaArgTer")
'MAIVMGRWKGAR*'
但我想让大家明白,我不能将 python 的字符串进行转换。我需要阅读 excel 中的一整列,并打印一个包含转换后的 1 字母序列的新列。图片供参考:
示例:
enter image description here
也许您可以尝试下面的脚本。您需要为所有可能的三个字母组合扩展它。希望对你有用。
# open file
import pandas as pd
df = pd.read_excel (r'file')
df.columns=['three letter code']
codes = []
for i in df['code']:
if i == 'uuu':
codes.append('U')
if i == 'cuu':
codes.append('C')
if i == 'uaa':
codes.append('A')
print (codes)
df['new_code']= codes
df
输出为:
code new_code
0 uuu U
1 cuu C
2 uaa A
我想将 excel 中的一列三字母氨基酸转换为一个字母,并将单字母氨基酸打印到 excel 文件中的每个相应行。我知道我可以为此使用 biopython。,
我尝试过的:
import Bio
from Bio.SeqUtils import seq1
seq1("MetAlaIleValMetGlyArgTrpLysGlyAlaArgTer")
'MAIVMGRWKGAR*'
但我想让大家明白,我不能将 python 的字符串进行转换。我需要阅读 excel 中的一整列,并打印一个包含转换后的 1 字母序列的新列。图片供参考:
示例: enter image description here
也许您可以尝试下面的脚本。您需要为所有可能的三个字母组合扩展它。希望对你有用。
# open file
import pandas as pd
df = pd.read_excel (r'file')
df.columns=['three letter code']
codes = []
for i in df['code']:
if i == 'uuu':
codes.append('U')
if i == 'cuu':
codes.append('C')
if i == 'uaa':
codes.append('A')
print (codes)
df['new_code']= codes
df
输出为:
code new_code
0 uuu U
1 cuu C
2 uaa A