Python 正则表达式:计算和替换数值

Python regex : compute and replace numeric values

我有一个正则表达式问题,它似乎不像我想象的那么普遍:我想提取所有具有 px 单位的数值,应用一些计算,然后在我的中重新注入新值细绳。我不想包含 px 字符串(参见下面的示例),但我可以使用另一种方法来保留它们,或者更改单位类型。

示例,将值乘以 2.5:

来自 "2px aperture 12px science 2.1px yummy cake"

我要"5 aperture 30 science 5.25 yummy cake"

我做了一个粗略的脚本,但我没有得到想要的输出:

import re
my_string = "2px aperture 12px science 2.1px yummy cake"
nb_list= re.findall(r"([0-9.]+)px", my_string)
splitted_string = re.findall('.*?px', my_string)
print(f"splitted_string = {splitted_string}")
print(f"nb_list = {nb_list}")
new_list = []
for i in range(0, len(nb_list)):
  new_n = str(float(nb_list[i])*2.5)
  new_string = re.sub(r"[0-9.]+px", new_n, splitted_string[i])
  new_list.append(new_string)
new_list = ''.join(new_list)
print(f"new_list = {new_list}")

结果:

new_list = 5.0 aperture 30.0 science 5.25

我明白为什么会得到这个结果,但我不知道要更改什么才能获得所需的输出。

只需使用 re.sub 和回调:

r = re.sub(
    r'(\d+(\.\d+)?)px\b',
    lambda m: '{:g}'.format(float(m.group(1)) * 2.5),
    s)

将其扩展到多个单元很容易,例如:

units = {
    'px': 2.5,
    'em': 4,
}

r = re.sub(
    fr'(\d+(\.\d+)?)({"|".join(units)})\b',
    lambda m: '{:g}'.format(float(m.group(1)) * units[m.group(3)]),
    s)