替换字符的 Pythonic 方式
Pythonic way to replace chars
我想使用 pythonic 方法替换字符串中的一些字符。
A -> T
C -> G
G -> C
T -> A
示例:
AAATCGATTGAT
会变身
TTTAGCTAACTA
我做了什么:
def swap(string):
string = re.sub('A', 'aux', string)
string = re.sub('T', 'A', string)
string = re.sub('aux', 'T', string)
string = re.sub('C', 'aux', string)
string = re.sub('G', 'C', string)
string = re.sub('aux', 'G', string)
return string
效果很好,但我正在寻找一种更符合 pythonic 的方法来实现它。
使用具有理解力的字典 str.join
:
translateDict = {
"A" : "T",
"C" : "G",
"G" : "C",
"T" : "A"
}
s1 = "AAATCGATTGAT"
reconstructed = "".join(translateDict.get(s, s) for s in s1)
这里有 live example
注意dict.get
的使用;如果该字母不在字典中,我们就让它保持原样。
正如@bravosierra99 所建议的,您也可以简单地使用 str.translate
:
reconstructed = s1.translate(string.maketrans(translateDict))
这是对当前接受的Chepner 已删除答案的重构,它只调用maketrans
一次。
tt = str.maketrans({"A":"T", "C":"G", "G":"C", "T": "A"})
for s1 in "AGACAT", "TAGGAC", "ACTAGAA":
print(s1.translate(tt))
也许还指出您可以链接 replace
的结果,尽管这仍然笨拙且效率低下:
def acgtgca(s1):
return s1.replace(
"A", "\ue0fa").replace(
"G", "\ue0fb").replace(
"C", "G").replace(
"T", "A").replace(
"\ue0fb", "C").replace(
"\ue0fa", "T")
这避免了使用“aux”作为支持 Unicode 中的两个任意字符的特殊标记 Private Use Area。
但同样,maketrans
方法更简洁、更高效。
我想使用 pythonic 方法替换字符串中的一些字符。
A -> T
C -> G
G -> C
T -> A
示例:
AAATCGATTGAT
会变身
TTTAGCTAACTA
我做了什么:
def swap(string):
string = re.sub('A', 'aux', string)
string = re.sub('T', 'A', string)
string = re.sub('aux', 'T', string)
string = re.sub('C', 'aux', string)
string = re.sub('G', 'C', string)
string = re.sub('aux', 'G', string)
return string
效果很好,但我正在寻找一种更符合 pythonic 的方法来实现它。
使用具有理解力的字典 str.join
:
translateDict = {
"A" : "T",
"C" : "G",
"G" : "C",
"T" : "A"
}
s1 = "AAATCGATTGAT"
reconstructed = "".join(translateDict.get(s, s) for s in s1)
这里有 live example
注意dict.get
的使用;如果该字母不在字典中,我们就让它保持原样。
正如@bravosierra99 所建议的,您也可以简单地使用 str.translate
:
reconstructed = s1.translate(string.maketrans(translateDict))
这是对当前接受的Chepner 已删除答案的重构,它只调用maketrans
一次。
tt = str.maketrans({"A":"T", "C":"G", "G":"C", "T": "A"})
for s1 in "AGACAT", "TAGGAC", "ACTAGAA":
print(s1.translate(tt))
也许还指出您可以链接 replace
的结果,尽管这仍然笨拙且效率低下:
def acgtgca(s1):
return s1.replace(
"A", "\ue0fa").replace(
"G", "\ue0fb").replace(
"C", "G").replace(
"T", "A").replace(
"\ue0fb", "C").replace(
"\ue0fa", "T")
这避免了使用“aux”作为支持 Unicode 中的两个任意字符的特殊标记 Private Use Area。
但同样,maketrans
方法更简洁、更高效。