如何在不破坏 ansi 转义码的情况下替换字符串？

Question

而不是打印 , the following script prints 。

s = '1\x1b[1;31m2\x1b[0m3'
print(s)
s = s.replace('1', ' ')
print(s)

据我所知，这是因为 .replace 操作破坏了 ANSI 转义码。但这是不幸的。

有什么简单的方法可以让 .replace、str.translate 或 re.sub 安全地忽略转义码？

Answer 1

使用之前答案中的 regex to match ANSI escape sequences，我们可以创建一个辅助函数，它只替换文本中不属于此类序列的部分。

假设这是 utils.py:

import re

# 
ANSICODE = re.compile(r'\x1B[@-_][0-?]*[ -/]*[@-~]')

def replace_ansi(imput_str, search_str, replace_str):
    pos = 0
    result = []
    for m in ANSICODE.finditer(imput_str):
        text = imput_str[pos:m.start()]
        text = text.replace(search_str, replace_str)
        result.append(text)
        result.append(m.group())
        pos = m.end()

    text = imput_str[pos:]
    result.append(text)
    return ''.join(result)

用法

from utils import replace_ansi

s1 = 'bla 1\x1b[1;31mbla 2\x1b[0mbla 3'
s2 = replace_ansi(s1, '1', 'X')
print(s1)
print(s2)

打印

bla 1[1;31mbla 2[0mbla 3
bla X[1;31mbla 2[0mbla 3

如何在不破坏 ansi 转义码的情况下替换字符串？

How to replace in string without breaking ansi escape codes?

python

replace

ansi-escape

python-3.x