替换字符的 Pythonic 方式

Question

我想使用 pythonic 方法替换字符串中的一些字符。

A -> T
C -> G
G -> C
T -> A

示例：

AAATCGATTGAT

会变身

TTTAGCTAACTA

我做了什么：

def swap(string):
    string = re.sub('A', 'aux', string)
    string = re.sub('T', 'A', string)
    string = re.sub('aux', 'T', string)
    string = re.sub('C', 'aux', string)
    string = re.sub('G', 'C', string)
    string = re.sub('aux', 'G', string)

    return string

效果很好，但我正在寻找一种更符合 pythonic 的方法来实现它。

Answer 1

使用具有理解力的字典 str.join:

translateDict = {
  "A" : "T",
  "C" : "G",
  "G" : "C",
  "T" : "A"
}

s1 = "AAATCGATTGAT"
reconstructed = "".join(translateDict.get(s, s) for s in s1)

这里有 live example

注意dict.get的使用；如果该字母不在字典中，我们就让它保持原样。

正如@bravosierra99 所建议的，您也可以简单地使用 str.translate:

reconstructed = s1.translate(string.maketrans(translateDict))

Answer 2

这是对~~当前接受的~~Chepner 已删除答案的重构，它只调用maketrans一次。

tt = str.maketrans({"A":"T", "C":"G", "G":"C", "T": "A"})
for s1 in "AGACAT", "TAGGAC", "ACTAGAA":
    print(s1.translate(tt))

也许还指出您可以链接 replace 的结果，尽管这仍然笨拙且效率低下：

def acgtgca(s1):
    return s1.replace(
        "A", "\ue0fa").replace(
        "G", "\ue0fb").replace(
        "C", "G").replace(
        "T", "A").replace(
        "\ue0fb", "C").replace(
        "\ue0fa", "T")

这避免了使用“aux”作为支持 Unicode 中的两个任意字符的特殊标记 Private Use Area。

但同样，maketrans 方法更简洁、更高效。

替换字符的 Pythonic 方式

Pythonic way to replace chars

python

replace

character-replacement