Python - 使用正则表达式将数字和字母拆分为子字符串

Python - Splitting numbers and letters into sub-strings with regular expression

我正在创建公制测量转换器。用户需要输入一个表达式,例如 125km(一个数字后跟一个单位缩写)。对于转换,数值必须从缩写中分离出来,产生如 [125, 'km'] 这样的结果。我用正则表达式 re.split 完成了此操作,但是它在结果列表中产生了不需要的项目:

import re
s = '125km'
print(re.split('(\d+)', s))

输出:

['', '125', 'km']

我不需要也不想要开头''。我怎样才能简单地将字符串的数字部分与字母部分分开以使用正则表达式生成列表?

re.findall 怎么了?

>>> s = '125km'
>>> re.findall(r'[A-Za-z]+|\d+', s)
['125', 'km']

[A-Za-z]+ 匹配一个或多个字母表。 |\d+ 一位或多位数字。

使用列表理解。

>>> [i for i in re.split(r'([A-Za-z]+)', s) if i]
['125', 'km']
>>> [i for i in re.split(r'(\d+)', s) if i]
['125', 'km']

将字符串拆分为 sub-string 列表(数字和其他)

使用程序:

s = "125km1234string"
sub = []
char = ""
num = ""
for letter in s:
    if letter.isdigit():
        if char:
            sub.append(char)
            char = ""
        num += letter
    else:
        if num:
            sub.append(num)
            num = ""
        char += letter
sub.append(char) if char else sub.append(num)
print(sub)

输出

['125', 'km', '1234', 'string']