如何在不破坏 ansi 转义码的情况下替换字符串?
How to replace in string without breaking ansi escape codes?
而不是打印 , the following script prints 。
s = '1\x1b[1;31m2\x1b[0m3'
print(s)
s = s.replace('1', ' ')
print(s)
据我所知,这是因为 .replace
操作破坏了 ANSI 转义码。但这是不幸的。
有什么简单的方法可以让 .replace
、str.translate
或 re.sub
安全地忽略转义码?
使用之前答案中的 regex to match ANSI escape sequences,我们可以创建一个辅助函数,它只替换文本中不属于此类序列的部分。
假设这是 utils.py:
import re
#
ANSICODE = re.compile(r'\x1B[@-_][0-?]*[ -/]*[@-~]')
def replace_ansi(imput_str, search_str, replace_str):
pos = 0
result = []
for m in ANSICODE.finditer(imput_str):
text = imput_str[pos:m.start()]
text = text.replace(search_str, replace_str)
result.append(text)
result.append(m.group())
pos = m.end()
text = imput_str[pos:]
result.append(text)
return ''.join(result)
用法
from utils import replace_ansi
s1 = 'bla 1\x1b[1;31mbla 2\x1b[0mbla 3'
s2 = replace_ansi(s1, '1', 'X')
print(s1)
print(s2)
打印
bla 1[1;31mbla 2[0mbla 3
bla X[1;31mbla 2[0mbla 3
而不是打印
s = '1\x1b[1;31m2\x1b[0m3'
print(s)
s = s.replace('1', ' ')
print(s)
据我所知,这是因为 .replace
操作破坏了 ANSI 转义码。但这是不幸的。
有什么简单的方法可以让 .replace
、str.translate
或 re.sub
安全地忽略转义码?
使用之前答案中的 regex to match ANSI escape sequences,我们可以创建一个辅助函数,它只替换文本中不属于此类序列的部分。
假设这是 utils.py:
import re
#
ANSICODE = re.compile(r'\x1B[@-_][0-?]*[ -/]*[@-~]')
def replace_ansi(imput_str, search_str, replace_str):
pos = 0
result = []
for m in ANSICODE.finditer(imput_str):
text = imput_str[pos:m.start()]
text = text.replace(search_str, replace_str)
result.append(text)
result.append(m.group())
pos = m.end()
text = imput_str[pos:]
result.append(text)
return ''.join(result)
用法
from utils import replace_ansi
s1 = 'bla 1\x1b[1;31mbla 2\x1b[0mbla 3'
s2 = replace_ansi(s1, '1', 'X')
print(s1)
print(s2)
打印
bla 1[1;31mbla 2[0mbla 3 bla X[1;31mbla 2[0mbla 3